python如何提取Chrome中的保存的网站登录用户名密码?

很多浏览器都贴心地提供了保存用户密码功能,用户一旦开启,就不需要每次都输入用户名、密码,非常方便。作为python脚本,能否拿到用户提前保存在浏览器中的用户名密码,用以自动登录呢?必须有,小爬已经提前踩过很多坑,找到了可行的方案。

以Chrome浏览器为例,浏览器中的用户数据(包含加密后的密码)都存在下图所示的位置中:

文件的路径就像这样 C: => Users => <Your_Name> => AppData =>Local => Google => Chrome => User Data =>Local State

由于每台电脑的用户名是不确定的,因此小爬这里用python中的OS库来动态得到:

python 复制代码
local_computer_directory_path = os.path.join(os.environ["USERPROFILE"], "AppData", "Local", "Google", "Chrome","User Data", "Local State")

知道了具体位置后,我们需要先拿到加密后的密文,显然该密码肯定不是以明文的形式保存在文件中,否则安全无法保证。获取密文之前,还得先知道用于加密的密钥,这需要先安装pycryptodomex库,直接用pip来安装即可。一切就绪,现在编写一个获取密钥的python函数:

python 复制代码
 import os,json,base64,sqlite3,win32crypt,shutil
 from Cryptodome.Cipher import AES
 #需要安装pip install pycryptodomex 库
 from datetime import  datetime, timedelta
 def fetching_encryption_key():
     '''动态获取保存用户数据的文件的路径,然后读出加密后的密文'''
     local_computer_directory_path = os.path.join(os.environ["USERPROFILE"], "AppData", "Local", "Google", "Chrome","User Data", "Local State")
     with open(local_computer_directory_path, "r", encoding="utf-8") as f:
         local_state_data = f.read()
         local_state_data = json.loads(local_state_data)
 
     # decoding the encryption key using base64
     encryption_key = base64.b64decode(
     local_state_data["os_crypt"]["encrypted_key"])
     
     # remove Windows Data Protection API (DPAPI) str
     encryption_key = encryption_key[5:]
     # return decrypted key
     return win32crypt.CryptUnprotectData(encryption_key, None, None, None, 0)[1]

有了这个密钥,咱们还需要编写一个解密的方法将密码变成明文,考虑到Chrome浏览器的版本80之前和之后用了截然不同的加密手段,因此,对应的解密方法也不同,小爬将他们一并整合到解密的函数中:

python 复制代码
def password_decryption(password, encryption_key):
    try:
        iv = password[3:15]
        password = password[15:]
        
        # generate cipher
        cipher = AES.new(encryption_key, AES.MODE_GCM, iv)
        
        # decrypt password
        return cipher.decrypt(password)[:-16].decode()
    except:
        
        try:
            return str(win32crypt.CryptUnprotectData(password, None, None, None, 0)[1])
        except:
            return "No Passwords"

核心搞定之后,还涉及到一个知识点,用于某个网站登录的用户名 以及加密后的密文存储在哪里?别急,还是之前提到的Local State文件,其实它是一个本地sqlite3数据库文件,我们可以借助sqlite3库以及sql语法轻松获取。当然需要先知道目标网站的域名,比如小爬就想取本地chrome浏览器中我自己保存用于登录博客园网站(base_url="cnblogs.com")的用户名密码。另外需要注意的是,同一个网站,浏览器是支持同时保存几组用户名密码的。代码示例如下:

python 复制代码
  def get_url_credential(base_url):
     '''如果chrome浏览器本地存储了OA密码,则返回用户和密码列表,否则返回False'''
     key = fetching_encryption_key()
     db_path = os.path.join(os.environ["USERPROFILE"], "AppData", "Local",
                         "Google", "Chrome", "User Data", "default", "Login Data")
     filename = "ChromePasswords.db"
     shutil.copyfile(db_path, filename) # 为了避免程序bug将原有的login Data 文件损坏,复制一份出来供程序用
     
     # connecting to the database
     db = sqlite3.connect(filename)
     cursor = db.cursor()
     cursor.execute("select origin_url, action_url, username_value, password_value, date_created, date_last_used from logins order by date_last_used")
     user_name,pass_word=None,None
     userInfos=[] # 用于存放多组同一个网站的用户名 密码
     for row in cursor.fetchall():
         main_url = row[0]
         if base_url in main_url:
             user_name = row[2]
             pass_word = password_decryption(row[3], key)
             userInfos.append([user_name,pass_word])
     cursor.close()
     db.close()
     try:
         os.remove(filename)
     except:
         pass
     return userInfos

还在围观吗?动手能力强的已经跃跃欲试,把它用到真正的办公自动化场景中了。希望这些对现实业务的思考和代码实现,能对您的工作有所启发。不管咋说,活到老,学到老。拒绝躺平,一起卷起来!

相关推荐
清水白石00810 分钟前
解构异步编程的两种哲学:从 asyncio 到 Trio,理解 Nursery 的魔力
运维·服务器·数据库·python
山海青风14 分钟前
图像识别零基础实战入门 1 计算机如何“看”一张图片
图像处理·python
一嘴一个橘子18 分钟前
spring-aop 的 基础使用 - 4 - 环绕通知 @Around
java
小毅&Nora34 分钟前
【Java线程安全实战】⑨ CompletableFuture的高级用法:从基础到高阶,结合虚拟线程
java·线程安全·虚拟线程
冰冰菜的扣jio35 分钟前
Redis缓存中三大问题——穿透、击穿、雪崩
java·redis·缓存
木风小助理35 分钟前
`mapfile`命令详解:Bash中高效的文本至数组转换工具
开发语言·chrome·bash
彼岸花开了吗42 分钟前
构建AI智能体:八十、SVD知识整理与降维:从数据混沌到语义秩序的智能转换
人工智能·python·llm
小璐猪头1 小时前
专为 Spring Boot 设计的 Elasticsearch 日志收集 Starter
java
山土成旧客1 小时前
【Python学习打卡-Day40】从“能跑就行”到“工程标准”:PyTorch训练与测试的规范化写法
pytorch·python·学习
ps酷教程1 小时前
HttpPostRequestDecoder源码浅析
java·http·netty