从0到1实现html文件转换为markdown文档(进度0.1)

Spider-Man

前言

当我们处理文档时,常常会遇到将HTML文档转换为Markdown文档的需求。这种转换的必要性源于对文档易读性、易编辑性和可移植性的追求。HTML作为一种标记语言,虽然功能强大且灵活,但其繁琐的标签和结构使得文档阅读和编辑变得有些复杂。相比之下,Markdown以其简洁的语法和纯文本的特性成为了一种更为便捷的选择。下面我就为大家介绍如何实现这种转换?

准备环境

1、node.js

2、git

执行指令顺序

克隆存储库

Clone the repo

安装npm依赖

npm install

测试 CLI

npm run test -- clip -u https://huggingface.co/docs/transformers/index

使用目录输入测试 CLI

npm run test -- clip -i examples/

爬取 AWS Neuron 文档

npm run test -- crawl -u https://awsdocs-neuron.readthedocs-hosted.com/en/v2.14.1/index.html -g https://awsdocs-neuron.readthedocs-hosted.com/en/v2.14.1/\*\*/\*

构建用于生产环境的版本

npm run build

用符号链接 CLI 以进行本地测试

npm install -g .

构建开发环境的版本

clipper clip -u https://huggingface.co/docs/transformers/index

移除符号链接

npm r clipper -g

报错及其解决方案

一、npm 错误!可以在以下位置找到此运行的完整日志

A complete log of this run can be found in: C:\Users\30524\AppData\Local\npm-cache_logs\2024-01-10T13_41_51_215Z-debug-0.log

解决方案

告诉本地 npm 使用官方的 npmjs.org 作为默认的包注册表。

  • 2、npm install -g @angular/cli

执行完成后

  • 1、将clipper文件夹中的package.json文件复制到github文件夹下
  • 2、npm install

  • 1、npm cache clean --force(清除缓存)
  • 2、npm install

二、没有修改权限

解决方案:

  • 1、
  • 确保所有用户组完全控制文件夹
  • 而后可以克隆

注意事项

1、使用open git bash here 复制网址时,不要ctrl+v,右击复制

2、否则会出现下图不明字符导致克隆失败

总结

今天是"失败的man",只是知道了几个报错该如何解决,还没来得及思考原理,今天就要结束了,各位道友,见谅!

相关推荐
ghfdgbg8 分钟前
12. AOP(记录日志)
前端
Xの哲學8 分钟前
Linux I3C驱动深度剖析: 从原理到实战的全面解析
linux·服务器·算法·架构·边缘计算
我命由我123458 分钟前
微信小程序 - 页面返回并传递数据(使用事件通道、操作页面栈)
开发语言·前端·javascript·微信小程序·小程序·前端框架·js
一水鉴天8 分钟前
整体设计 定稿 备忘录仪表盘方案 之1 初稿之8 V5版本的主程序 之2: 自动化导航 + 定制化服务 + 个性化智能体(豆包助手)
前端·人工智能·架构
黛琳ghz13 分钟前
机密计算与安全容器:openEuler安全生态深度测评
服务器·数据库·安全·计算机·操作系统·openeuler
AI营销快线17 分钟前
2025金融AI语音质检系统选型指南
笔记
vortex520 分钟前
【Web开发】从WSGI到Servlet再到Spring Boot
前端·spring boot·servlet
casdfxx20 分钟前
配置v3s支持8188eu、8192cu网卡(三)-openssh不能登录linux开发板。
linux·服务器·网络
gaize121321 分钟前
服务器数据如何恢复,看这里
运维·服务器
chian-ocean21 分钟前
基于openEuler集群的OpenStack云计算平台基础部署实战指南
服务器·云计算·openstack