当我们处理文档时,常常会遇到将HTML文档转换为Markdown文档的需求。这种转换的必要性源于对文档易读性、易编辑性和可移植性的追求。HTML作为一种标记语言,虽然功能强大且灵活,但其繁琐的标签和结构使得文档阅读和编辑变得有些复杂。相比之下,Markdown以其简洁的语法和纯文本的特性成为了一种更为便捷的选择。下面我就为大家介绍如何实现这种转换?
克隆存储库
Clone the repo
安装npm依赖
npm install
测试 CLI
npm run test – clip -u https://huggingface.co/docs/transformers/index
使用目录输入测试 CLI
npm run test – clip -i examples/
爬取 AWS Neuron 文档
npm run test – crawl -u https://awsdocs-neuron.readthedocs-hosted.com/en/v2.14.1/index.html -g https://awsdocs-neuron.readthedocs-hosted.com/en/v2.14.1/**/*
构建用于生产环境的版本
npm run build
用符号链接 CLI 以进行本地测试
npm install -g .
构建开发环境的版本
clipper clip -u https://huggingface.co/docs/transformers/index
移除符号链接
npm r clipper -g
A complete log of this run can be found in: C:\Users\30524\AppData\Local\npm-cache_logs\2024-01-10T13_41_51_215Z-debug-0.log
①
告诉本地 npm 使用官方的 npmjs.org 作为默认的包注册表。
执行完成后
②
③
①
1、使用open git bash here 复制网址时,不要ctrl+v,右击复制
2、否则会出现下图不明字符导致克隆失败
今天是“失败的man”,只是知道了几个报错该如何解决,还没来得及思考原理,今天就要结束了,各位道友,见谅!