获得Python in Excel的preview之后, 就在任意的Excel单元格里可以敲=py(
来写Python代码了。不过Python in Excel并没有什么专门的文档, 只有一些Get Started 教程, 比如link 1, link 2, 剩下的就是pandas
, matplotlib
, seaborn
等lib的文章,和Python in Excel并没有什么关系。所以刚进入Python in Excel时,对这个新的环境会有很多疑问,这篇文章主要是分享一些我的一些理解和使用心得。
从单元格取值
在Python in Excel中, 我们可以用xl()
函数获取从单元格,列,行乃至sheet中获取数据。如果要获取其他sheet中的数据,按照xl('SheetName!A1:B2')
这样的方式写就可以. 如果 xl()
函数引用的值的范围超过了一个单元格,那么它返回的值是一个DataFrame
对象.
如果在Excel中多单元格设置了类型(category),那么xl()
返回的类型的对应管辖如下所示:

Python运行时
Python in Excel的Python运行时(runtime)是部署在Microsoft Cloud上的,所以在Excel中敲下 ctrl
+ enter
时,Excel中的代码和数据都会被传送到云端执行,执行完从云端取回结果。
从Excel菜单的Formulas -> Python -> Initiallization
,我们可以看到这个运行时是如何被初始化的,有哪些库会被默认加载,哪些默认值会被设置。

除了像 numpy
, pandas
(其他你可以import的库可以参考这篇文档 )这些常用的数据处理的库之外,excel
这个库(或者应该被称作一个依赖)主要负责Excel中的数据转换,以及Excel与Microsoft Cloud的数据传输等任务,比如:用于从Excel的sheet中获取数据的xl()
函数; 你也可以通过excel.uploadeddata.get_runtime_id()
函数来获取一个当前Python运行时的uuid。我没有找到微软官方关于excel
这个库的文档,可以需要以后在进一步挖掘了。
一个打开的Excel文档中的全部sheet以及sheet中的全部单元格都会共享同一个Python运行时。这就意味着如果你在任意一个单元格中声明的函数、变量和类,都可以在其他的的单元格的代码中引用到。举个例子,

网络请求
我们实际上是可以在Python in Excel的Python代码中import像socket
, http
, reqeuests
这些库的。不过可能是出于安全原因,在运行时的容器中应该是存在防火墙或者是禁止掉了网络的使用,所以我们并不能实际发出任何请求。这样的话,我们也就不能动态在Python in Excel的代码中加载任何代码和外部数据。
如果未来版本的Python in Excel提供了私有化部署的解决方案,网络请求应该不是什么问题,我也不用担心自己的数据有被微软乃至其他第三方获取的可能性。
检查Python对象的值
在Python shell中(或者IDLE),我们经常可以使用dir()
, help()
, type()
这些辅助方法来检查当前Python运行时中的一些对象和类的结构,或者是获取相关的使用帮助,这样绝对是编程时的调试神器。在Python in Excel中,虽然Excel并没有给我们一个shell,但我们也可以做类似的事情。
举个例子,我们可以对excel
模块使用dir()
函数,来看看excel
模块中有哪些方法,并把这些方法返回到一个column中:

我们可以把对一些对象的值的检查工作组织成一个list来返回,这样可以节省不少在云端执行代码的时间:

除了检查对模块的内容,我们对Python代码中的任意中间值进行检查,这样就几乎可以像使用Jupyter一样的来使用Python in Excel了。
把Excel的sheet作为库来加载
前文已经提到,我们不能动态的通过网络请求来加载远端的Python代码。如果我们想使用一些库,比如一些自己的常用代码,我们还是需要一些方法来加载它们。
目前的一些临时的解决方案是把需要复用的代码都单独的放在一个sheet里(保存在独立的.xlsx文件中),这样在需要使用这些代码时,我们就可以把整个sheet拷贝到当前的.xlsx文件中来加载。
错误信息的处理
目前Python in Excel只会返回很简单的错误信息,也就是Exception
对象的message中的内容。如果你需要详细的stack trace的信息,可以封装一下try/except代码块,让Python in Excel把错误栈作为一个list返回回来。比如:
ini
import traceback
ret = ''
try:
# your code or function
ret = xxx()
except:
ret = traceback.format_exc().split('\n')
ret
上面代码中的.split('\n')
是为了把错误信息切割成多个单元格来展示(每个单元格一行,整体在一个column中)。为了更好的展示错误信息,最好把单元格的字体设置为等宽字体。
其他值得注意的地方
- Python in Excel的多行输出会忽略掉换行符
\n
。 xl()
函数可以正确从单元格中读取换行符\n
。- Python in Excel不能读取插入的对象,比如作为附件的文件。
- 目前还不能在Python in Excel指定返回值输出到的单元格,只能以
=py(
所在的当前单元格为基点来输出。
本文的英文版本见 medium.com/@socratesle...