Python in Excel的一些使用心得

获得Python in Excel的preview之后, 就在任意的Excel单元格里可以敲=py(来写Python代码了。不过Python in Excel并没有什么专门的文档, 只有一些Get Started 教程, 比如link 1, link 2, 剩下的就是pandas, matplotlib, seaborn等lib的文章，和Python in Excel并没有什么关系。所以刚进入Python in Excel时，对这个新的环境会有很多疑问，这篇文章主要是分享一些我的一些理解和使用心得。

从单元格取值

在Python in Excel中, 我们可以用xl()函数获取从单元格，列，行乃至sheet中获取数据。如果要获取其他sheet中的数据，按照xl('SheetName!A1:B2')这样的方式写就可以. 如果 xl()函数引用的值的范围超过了一个单元格，那么它返回的值是一个DataFrame对象.

如果在Excel中多单元格设置了类型（category），那么xl()返回的类型的对应管辖如下所示:

Python运行时

Python in Excel的Python运行时（runtime）是部署在Microsoft Cloud上的，所以在Excel中敲下 ctrl + enter时，Excel中的代码和数据都会被传送到云端执行，执行完从云端取回结果。

从Excel菜单的Formulas -> Python -> Initiallization，我们可以看到这个运行时是如何被初始化的，有哪些库会被默认加载，哪些默认值会被设置。

除了像 numpy, pandas（其他你可以import的库可以参考这篇文档）这些常用的数据处理的库之外，excel这个库（或者应该被称作一个依赖）主要负责Excel中的数据转换，以及Excel与Microsoft Cloud的数据传输等任务，比如：用于从Excel的sheet中获取数据的xl()函数；你也可以通过excel.uploadeddata.get_runtime_id()函数来获取一个当前Python运行时的uuid。我没有找到微软官方关于excel这个库的文档，可以需要以后在进一步挖掘了。

一个打开的Excel文档中的全部sheet以及sheet中的全部单元格都会共享同一个Python运行时。这就意味着如果你在任意一个单元格中声明的函数、变量和类，都可以在其他的的单元格的代码中引用到。举个例子，

网络请求

我们实际上是可以在Python in Excel的Python代码中import像socket, http, reqeuests这些库的。不过可能是出于安全原因，在运行时的容器中应该是存在防火墙或者是禁止掉了网络的使用，所以我们并不能实际发出任何请求。这样的话，我们也就不能动态在Python in Excel的代码中加载任何代码和外部数据。

如果未来版本的Python in Excel提供了私有化部署的解决方案，网络请求应该不是什么问题，我也不用担心自己的数据有被微软乃至其他第三方获取的可能性。

检查Python对象的值

在Python shell中（或者IDLE），我们经常可以使用dir(), help(), type()这些辅助方法来检查当前Python运行时中的一些对象和类的结构，或者是获取相关的使用帮助，这样绝对是编程时的调试神器。在Python in Excel中，虽然Excel并没有给我们一个shell，但我们也可以做类似的事情。

举个例子，我们可以对excel模块使用dir()函数，来看看excel模块中有哪些方法，并把这些方法返回到一个column中：

我们可以把对一些对象的值的检查工作组织成一个list来返回，这样可以节省不少在云端执行代码的时间：

除了检查对模块的内容，我们对Python代码中的任意中间值进行检查，这样就几乎可以像使用Jupyter一样的来使用Python in Excel了。

把Excel的sheet作为库来加载

前文已经提到，我们不能动态的通过网络请求来加载远端的Python代码。如果我们想使用一些库，比如一些自己的常用代码，我们还是需要一些方法来加载它们。

目前的一些临时的解决方案是把需要复用的代码都单独的放在一个sheet里（保存在独立的.xlsx文件中），这样在需要使用这些代码时，我们就可以把整个sheet拷贝到当前的.xlsx文件中来加载。

错误信息的处理

目前Python in Excel只会返回很简单的错误信息，也就是Exception对象的message中的内容。如果你需要详细的stack trace的信息，可以封装一下try/except代码块，让Python in Excel把错误栈作为一个list返回回来。比如：

ini 复制代码

import traceback

ret = ''

try:
    # your code or function
    ret = xxx()
except:
    ret = traceback.format_exc().split('\n')

ret

上面代码中的.split('\n') 是为了把错误信息切割成多个单元格来展示（每个单元格一行，整体在一个column中）。为了更好的展示错误信息，最好把单元格的字体设置为等宽字体。

其他值得注意的地方

Python in Excel的多行输出会忽略掉换行符\n。
xl()函数可以正确从单元格中读取换行符\n。
Python in Excel不能读取插入的对象，比如作为附件的文件。
目前还不能在Python in Excel指定返回值输出到的单元格，只能以=py(所在的当前单元格为基点来输出。

本文的英文版本见 medium.com/@socratesle...