python如何提取Chrome中的保存的网站登录用户名密码?

很多浏览器都贴心地提供了保存用户密码功能,用户一旦开启,就不需要每次都输入用户名、密码,非常方便。作为python脚本,能否拿到用户提前保存在浏览器中的用户名密码,用以自动登录呢?必须有,小爬已经提前踩过很多坑,找到了可行的方案。

以Chrome浏览器为例,浏览器中的用户数据(包含加密后的密码)都存在下图所示的位置中:

文件的路径就像这样 C: => Users => <Your_Name> => AppData =>Local => Google => Chrome => User Data =>Local State

由于每台电脑的用户名是不确定的,因此小爬这里用python中的OS库来动态得到:

python 复制代码
local_computer_directory_path = os.path.join(os.environ["USERPROFILE"], "AppData", "Local", "Google", "Chrome","User Data", "Local State")

知道了具体位置后,我们需要先拿到加密后的密文,显然该密码肯定不是以明文的形式保存在文件中,否则安全无法保证。获取密文之前,还得先知道用于加密的密钥,这需要先安装pycryptodomex库,直接用pip来安装即可。一切就绪,现在编写一个获取密钥的python函数:

python 复制代码
 import os,json,base64,sqlite3,win32crypt,shutil
 from Cryptodome.Cipher import AES
 #需要安装pip install pycryptodomex 库
 from datetime import  datetime, timedelta
 def fetching_encryption_key():
     '''动态获取保存用户数据的文件的路径,然后读出加密后的密文'''
     local_computer_directory_path = os.path.join(os.environ["USERPROFILE"], "AppData", "Local", "Google", "Chrome","User Data", "Local State")
     with open(local_computer_directory_path, "r", encoding="utf-8") as f:
         local_state_data = f.read()
         local_state_data = json.loads(local_state_data)
 
     # decoding the encryption key using base64
     encryption_key = base64.b64decode(
     local_state_data["os_crypt"]["encrypted_key"])
     
     # remove Windows Data Protection API (DPAPI) str
     encryption_key = encryption_key[5:]
     # return decrypted key
     return win32crypt.CryptUnprotectData(encryption_key, None, None, None, 0)[1]

有了这个密钥,咱们还需要编写一个解密的方法将密码变成明文,考虑到Chrome浏览器的版本80之前和之后用了截然不同的加密手段,因此,对应的解密方法也不同,小爬将他们一并整合到解密的函数中:

python 复制代码
def password_decryption(password, encryption_key):
    try:
        iv = password[3:15]
        password = password[15:]
        
        # generate cipher
        cipher = AES.new(encryption_key, AES.MODE_GCM, iv)
        
        # decrypt password
        return cipher.decrypt(password)[:-16].decode()
    except:
        
        try:
            return str(win32crypt.CryptUnprotectData(password, None, None, None, 0)[1])
        except:
            return "No Passwords"

核心搞定之后,还涉及到一个知识点,用于某个网站登录的用户名 以及加密后的密文存储在哪里?别急,还是之前提到的Local State文件,其实它是一个本地sqlite3数据库文件,我们可以借助sqlite3库以及sql语法轻松获取。当然需要先知道目标网站的域名,比如小爬就想取本地chrome浏览器中我自己保存用于登录博客园网站(base_url="cnblogs.com")的用户名密码。另外需要注意的是,同一个网站,浏览器是支持同时保存几组用户名密码的。代码示例如下:

python 复制代码
  def get_url_credential(base_url):
     '''如果chrome浏览器本地存储了OA密码,则返回用户和密码列表,否则返回False'''
     key = fetching_encryption_key()
     db_path = os.path.join(os.environ["USERPROFILE"], "AppData", "Local",
                         "Google", "Chrome", "User Data", "default", "Login Data")
     filename = "ChromePasswords.db"
     shutil.copyfile(db_path, filename) # 为了避免程序bug将原有的login Data 文件损坏,复制一份出来供程序用
     
     # connecting to the database
     db = sqlite3.connect(filename)
     cursor = db.cursor()
     cursor.execute("select origin_url, action_url, username_value, password_value, date_created, date_last_used from logins order by date_last_used")
     user_name,pass_word=None,None
     userInfos=[] # 用于存放多组同一个网站的用户名 密码
     for row in cursor.fetchall():
         main_url = row[0]
         if base_url in main_url:
             user_name = row[2]
             pass_word = password_decryption(row[3], key)
             userInfos.append([user_name,pass_word])
     cursor.close()
     db.close()
     try:
         os.remove(filename)
     except:
         pass
     return userInfos

还在围观吗?动手能力强的已经跃跃欲试,把它用到真正的办公自动化场景中了。希望这些对现实业务的思考和代码实现,能对您的工作有所启发。不管咋说,活到老,学到老。拒绝躺平,一起卷起来!

相关推荐
aq55356006 分钟前
编程语言三巨头:汇编、C++与PHP大比拼
java·开发语言
学弟15 分钟前
【内涵】深度学习中的三种变量及pytorch中对应的三种tensor
人工智能·pytorch·python
2301_7775993720 分钟前
mysql如何进行数据库容量规划_评估磁盘空间增长趋势
jvm·数据库·python
aq553560024 分钟前
PHP vs Python:30秒看懂核心区别
开发语言·python·php
我是无敌小恐龙27 分钟前
Java SE 零基础入门Day01 超详细笔记(开发前言+环境搭建+基础语法)
java·开发语言·人工智能·opencv·spring·机器学习
m0_377618231 小时前
Redis怎样应对大规模集群的重启风暴_分批次重启节点并等待集群状态恢复绿灯后再继续操作
jvm·数据库·python
心态与习惯1 小时前
Julia 初探,及与 C++,Java,Python 的比较
java·c++·python·julia·比较
一叶飘零_sweeeet1 小时前
优秀文章合集
java
ZC跨境爬虫2 小时前
3D 地球卫星轨道可视化平台开发 Day8(分步渲染200颗卫星+ 前端分页控制)
前端·python·3d·重构·html
zopple2 小时前
ThinkPHP5.x与3.x核心差异解析
java·python·php