x-cmd pkg | franc-cli - 文本语言检测工具

发布时间:2024年01月20日

简介

franc-cli 是文本语言检测工具,用于识别文本所使用的自然语言,最多可识别 419 种语言。

注意

  • franc 参与的决策过程的语言很多,这意味着它对短文本片段的检测是不够准确的。
  • franc 返回 ISO 639-3 代码(三个字母代码)。而不是ISO 639-1 或 ISO 639-2。

首次用户

  1. 使用 x env use franc-cli 即可自动下载并使用

    • 在终端运行 eval "$(curl https://get.x-cmd.com)" 即可完成 x 命令安装, 详情参考 x-cmd 官网
  2. x-cmd 提供1分钟教程,其中包含了 franc-cli 命令常用功能的 demo 示例,可以帮你快速上手 franc-cli 。

  3. 使用案例:

    franc-cli-1min-cn

    # 安装 franc-cli
    x env use franc-cli
    
    # 检测文本自然语言,cmn 代表普通话中文,eng 代表英文
    franc "Alle menslike wesens word vry"
    
    # 检测标准输入中文本的自然语言
    echo "??? ???? ???? ??? IBM ?????????" | franc
    
    # 忽略某些语言
    franc --ignore por,glg "O Brasil caiu 26 posi??es"
    
    # 指定语言范围
    echo "Alle mennesker er f?dt frie og" | franc --only nob,dan
    

功能特点

  1. 支持比任何其他库更多的语言提供 3 类语言包,默认使用的 franc 语言支持 187 种语言,franc-min 语言包支持 82 种语言,franc-all 语言包支持 419 种语言。
  2. 相应的衍生作品可移植到其他语言franc 有多种编程语言的移植版,包括 GO、R、Rust、Python 等。

竞品和相关作品

  1. whatlang-rs:franc 的衍生作品,使用 Rust 编写,支持 69 种语言。

  2. lingua-go:Go 语言编写的自然语言检测库,适用于短文本和混合语言文本,支持 75 种语言。

进一步阅读

  • franc-cli 源代码 - franc-cli 项目的源代码托管在 GitHub,你可以在这里找到最新版本的 franc-cli 和参与社区贡献。
文章来源:https://blog.csdn.net/edwinjhlee/article/details/135697576
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。