Python in Excel的一些使用心得

获得Python in Excel的preview之后, 就在任意的Excel单元格里可以敲=py(来写Python代码了。不过Python in Excel并没有什么专门的文档, 只有一些Get Started 教程, 比如link 1, link 2, 剩下的就是pandas, matplotlib, seaborn等lib的文章,和Python in Excel并没有什么关系。所以刚进入Python in Excel时,对这个新的环境会有很多疑问,这篇文章主要是分享一些我的一些理解和使用心得。

从单元格取值

在Python in Excel中, 我们可以用xl()函数获取从单元格,列,行乃至sheet中获取数据。如果要获取其他sheet中的数据,按照xl('SheetName!A1:B2')这样的方式写就可以. 如果 xl()函数引用的值的范围超过了一个单元格,那么它返回的值是一个DataFrame对象.

如果在Excel中多单元格设置了类型(category),那么xl()返回的类型的对应管辖如下所示:

Python运行时

Python in Excel的Python运行时(runtime)是部署在Microsoft Cloud上的,所以在Excel中敲下 ctrl + enter时,Excel中的代码和数据都会被传送到云端执行,执行完从云端取回结果。

从Excel菜单的Formulas -> Python -> Initiallization,我们可以看到这个运行时是如何被初始化的,有哪些库会被默认加载,哪些默认值会被设置。

除了像 numpy, pandas(其他你可以import的库可以参考这篇文档 )这些常用的数据处理的库之外,excel这个库(或者应该被称作一个依赖)主要负责Excel中的数据转换,以及Excel与Microsoft Cloud的数据传输等任务,比如:用于从Excel的sheet中获取数据的xl()函数; 你也可以通过excel.uploadeddata.get_runtime_id()函数来获取一个当前Python运行时的uuid。我没有找到微软官方关于excel这个库的文档,可以需要以后在进一步挖掘了。

一个打开的Excel文档中的全部sheet以及sheet中的全部单元格都会共享同一个Python运行时。这就意味着如果你在任意一个单元格中声明的函数、变量和类,都可以在其他的的单元格的代码中引用到。举个例子,

网络请求

我们实际上是可以在Python in Excel的Python代码中import像socket, http, reqeuests这些库的。不过可能是出于安全原因,在运行时的容器中应该是存在防火墙或者是禁止掉了网络的使用,所以我们并不能实际发出任何请求。这样的话,我们也就不能动态在Python in Excel的代码中加载任何代码和外部数据。

如果未来版本的Python in Excel提供了私有化部署的解决方案,网络请求应该不是什么问题,我也不用担心自己的数据有被微软乃至其他第三方获取的可能性。

检查Python对象的值

在Python shell中(或者IDLE),我们经常可以使用dir(), help(), type()这些辅助方法来检查当前Python运行时中的一些对象和类的结构,或者是获取相关的使用帮助,这样绝对是编程时的调试神器。在Python in Excel中,虽然Excel并没有给我们一个shell,但我们也可以做类似的事情。

举个例子,我们可以对excel模块使用dir()函数,来看看excel模块中有哪些方法,并把这些方法返回到一个column中:

我们可以把对一些对象的值的检查工作组织成一个list来返回,这样可以节省不少在云端执行代码的时间:

除了检查对模块的内容,我们对Python代码中的任意中间值进行检查,这样就几乎可以像使用Jupyter一样的来使用Python in Excel了。

把Excel的sheet作为库来加载

前文已经提到,我们不能动态的通过网络请求来加载远端的Python代码。如果我们想使用一些库,比如一些自己的常用代码,我们还是需要一些方法来加载它们。

目前的一些临时的解决方案是把需要复用的代码都单独的放在一个sheet里(保存在独立的.xlsx文件中),这样在需要使用这些代码时,我们就可以把整个sheet拷贝到当前的.xlsx文件中来加载。

错误信息的处理

目前Python in Excel只会返回很简单的错误信息,也就是Exception对象的message中的内容。如果你需要详细的stack trace的信息,可以封装一下try/except代码块,让Python in Excel把错误栈作为一个list返回回来。比如:

ini 复制代码
import traceback

ret = ''

try:
    # your code or function
    ret = xxx()
except:
    ret = traceback.format_exc().split('\n')

ret

上面代码中的.split('\n') 是为了把错误信息切割成多个单元格来展示(每个单元格一行,整体在一个column中)。为了更好的展示错误信息,最好把单元格的字体设置为等宽字体。

其他值得注意的地方

  • Python in Excel的多行输出会忽略掉换行符\n
  • xl()函数可以正确从单元格中读取换行符\n
  • Python in Excel不能读取插入的对象,比如作为附件的文件。
  • 目前还不能在Python in Excel指定返回值输出到的单元格,只能以=py(所在的当前单元格为基点来输出。

本文的英文版本见 medium.com/@socratesle...

相关推荐
java1234_小锋25 分钟前
一周学会Flask3 Python Web开发-redirect重定向
前端·python·flask·flask3
重生之我要成为代码大佬25 分钟前
Python天梯赛10分题-念数字、求整数段和、比较大小、计算阶乘和
开发语言·数据结构·python·算法
Daitu_Adam30 分钟前
Windows11安装GPU版本Pytorch2.6教程
人工智能·pytorch·python·深度学习
阿正的梦工坊33 分钟前
Grouped-Query Attention(GQA)详解: Pytorch实现
人工智能·pytorch·python
码界筑梦坊1 小时前
基于Flask的短视频流量数据可视化系统的设计与实现
大数据·python·信息可视化·flask·毕业设计
eso19831 小时前
Spark MLlib使用流程简介
python·算法·spark-ml·推荐算法
littleBoy7771 小时前
使用excel中的VBA合并多个excel文件
excel·vba
dme.2 小时前
Python爬虫基础文件操作
爬虫·python
小白教程2 小时前
Python连接MySQL数据库图文教程,Python连接数据库MySQL入门教程
数据库·python·mysql·python链接数据库·python链接mysql
weixin_307779132 小时前
PySpark实现GROUP BY WITH CUBE和WITH ROLLUP的分类汇总功能
大数据·开发语言·python·spark