GitHub一周热点汇总第5期 (2024/01/07-01/13),梳理每周热门的GitHub项目,这一周的热门项目都普遍比较年轻,有几个更是刚刚发布就火热起来了,一起来看看都有哪些项目吧。
本项目的内容从名字就能大概猜到了,没错,就是一个针对大语言模型的课程。本项目中包含了学习大语言模型的roadmap和colab notebook,很适合从头来学习入门一下LLM。学习党们可以出手了,赶快学起来吧。
项目分成3个部分,分别是:
下面是基础知识部分和LLM科学家部分的roadmap,LLM工程师的部分还暂时没有更新,大家要稍微等等。
这是项目的GitHub star历史,上周突然一下子就火爆起来了。
又是一款ChatGPT的替代品,但是与一般的OpenAI套壳产品不太一样的地方在于,它希望把AI能力放到你本地的环境中。Jan支持从 PC 到多 GPU 集群的各种类型环境,帮助你在100%离线的在本地构建一个ChatGPT。
以下是Jan支持运行环境类型:
由于是在本地部署和运行的LLM,因此使用Jan理论上可以获得一些优势:
隐私:全本地化的数据,避免了泄露的可能
可定制:可以微调模型或者是定制自己的产品页面。
另外就是如果本地的性能足够强大,是可以获得更好的使用速度和稳定性的。
crewAI 是一个针对AI agent的编排框架,它希望可以让ai agent之间更加智能的协同工作,进而让整个AI 体系可以独立完成复杂的任务。
CrewAI 旨在使人工智能代理能够承担角色、分享目标并在一个有凝聚力的单元中运作——就像一个运转良好的团队。无论您是要构建智能助理平台、自动化客户服务整体还是多代理研究团队,CrewAI 都可以为复杂的多代理交互提供支撑。
CrewAI的主要特性:
1brc就是 One Billion Row Challenge ,项目实际上是一个关于JAVA的挑战,使用JAVA处理一个10亿行的文件,怎么样Java大神的竞赛的基因动了吗,有兴趣的话,也可以去提交一下。
发起者希望探讨现代 Java 在聚合文本文件中的 10 亿行方面能走多远,挑战要求从处理一个文本文件,它包含一系列气象站的温度值,一共有10亿行。各路大神请使用各种可能的技术,比如虚拟线程、SIMD、优化GC,最终获取最好的运行速度。
目前已经有一些开始提交了,有兴趣的快动手吧,挑战一直持续到1月底。
这是个国人项目,打开项目的所有介绍都是中文优先的,对国内是非常友好。
Umi-OCR是开源、免费的离线OCR软件。支持截屏/粘贴/批量导入图片,段落排版/排除水印,扫描/生成二维码。内置多国语言库。
下面是它的主要特点:
本应用适用于 Windows7 x64 及以上,这点对于平时使用Mac的我有点可惜,如果你是Windows用户,就去试试吧。