【字体加密解决方案】某茄小说、某眼电影、某车帝、二手车网站

字体加密解码小工具

假设我们遇到了字体加密下载他的字体,转一个ttf

先把woff2转xml方便取出cmap ,然后吧所有cmap的key拿出来

python 复制代码
from  fontTools.ttLib import TTFont

from font_parse.font_to_img import font_to_img

woff2_path = "y8dl0-28arr.ttf"
font = TTFont('e26e946d8b2ccb7.woff2')
font.saveXML('font1.xml')
font_map = font.getBestCmap()
print(font_map)
font.close()
unicode_list=[chr(key) for key, _ in font_map.items()]
print(unicode_list)
normal_dict, error_dict = font_to_img(unicode_list, woff2_path)
print(normal_dict)
print(error_dict)

这个key就是字对应的Unicode的码

我们拿到这个码先encode在decode保证编码 统一

先加载字体文件

然后开一个画布,创建绘画对象,配置好大小,在根据这个码和对应的字体文件,在图像中绘制文本

最后使用ocr识别这个图片是什么文字,这个方法有个95%成功率。也算是个懒人解决方案了

python 复制代码
from PIL import ImageFont, Image, ImageDraw

from cnocr import CnOcr
import numpy as np
def font_to_img(code_list, filename, ignore_flag=True, score=0.95):
    normal_dict = {}
    be_padding_dict = {}
    ocr = CnOcr()
    """
        将字体画成图片
        code_list: 加密字符列表
        filename: 字体文件
        ignore_flag:是否忽视 sorce 返回结果
        score: 识别准确率默认 95%以上
    """
    img_size = 1024
    font = ImageFont.truetype(filename, int(img_size * 0.7))  # 加载指定文件名的 TrueType 字体文件,并设置字体大小为图像高度的 70%
    for char in code_list:
        char_code = char.encode().decode()  # 编码成字节序列,然后再解码成字符串。确保字符编码的一致性。
        img = Image.new('1', (img_size, img_size), 255) # 创建 1024*1024 背景颜色为白色(255)。参数 '1' 表示使用二值化(单色)模式。
        draw = ImageDraw.Draw(img)  # 创建一个图像绘制对象,用于在图像上绘制文本
        x, y = draw.textsize(char_code, font=font)   # 计算绘制字符所需的文本区域大小。


        draw.text(((img_size - x) // 2, (img_size - y) // 2), char_code, font=font, fill=0)  # 在图像中心绘制文本,填充颜色为黑色(0)。这里通过计算使文本位于图像中心。

        # ocr部分
        # 将单通道 转为 三通道
        img = img.convert("RGB")
        # word = ocr.ocr_for_single_line("%s.jpg" % mame_ocr)
        word = ocr.ocr_for_single_line(np.array(img))
        if word["score"] >= score:
            # 处理重复名字
            # img.save("%s_%s.jpg" % (char_code, word["text"]))
            normal_dict[char_code] = word["text"]
        else:
            be_padding_dict[char_code] = word
            img.save("./image/%s_%s_be_padding.jpg" % (char_code, word["text"]))
            if ignore_flag:
                normal_dict[char_code] = word["text"]
    return normal_dict, be_padding_dict
相关推荐
进击的六角龙1 小时前
Python中处理Excel的基本概念(如工作簿、工作表等)
开发语言·python·excel
一只爱好编程的程序猿1 小时前
Java后台生成指定路径下创建指定名称的文件
java·python·数据下载
Aniay_ivy1 小时前
深入探索 Java 8 Stream 流:高效操作与应用场景
java·开发语言·python
gonghw4032 小时前
DearPyGui学习
python·gui
向阳12182 小时前
Bert快速入门
人工智能·python·自然语言处理·bert
engchina2 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j
兆。2 小时前
掌握 PyQt5:从零开始的桌面应用开发
开发语言·爬虫·python·qt
南宫理的日知录2 小时前
99、Python并发编程:多线程的问题、临界资源以及同步机制
开发语言·python·学习·编程学习
coberup2 小时前
django Forbidden (403)错误解决方法
python·django·403错误
龙哥说跨境3 小时前
如何利用指纹浏览器爬虫绕过Cloudflare的防护?
服务器·网络·python·网络爬虫