我为什么做开源?

开源到书籍

从《ChatGPT原理与应用开发》这本书开始吧,它获得了异步2024年影响力图书。这本身是一个开源项目HuggingLLM,当时(23年4月)的初衷很简单,就是想帮助更多的中小企业使用AI,让非算法的工程师也能借助AI实现算法相关功能和服务。另外,本书另一位作者玉琳说网上太多智商税的课程了,觉得我们应该做点什么,于是一拍即合就有了这个项目。但具体开始做的时候,我觉得还是应该有一些创新,并且内容的生命力尽量持久些。思来想去,再结合市场调研结果,决定以NLP算法常见任务为导向,通过借助LLM让普通程序员也能做NLP算法工程师的工作。同时内容尽量保持实战性,代码可直接复用到工作环境。这是从NLP范式角度展开的一本书,是最大的创新点,同时范式是不容易改变的,也保证了书籍的生命力。

书籍出版后,其实还是有点担心的,我当时对这本书的评价是有一定价值,但整体质量其实一般。不过有一点我觉得是好的,就是到现在为止书的框架依然是正确的,且目测会在很长一段时间内仍然有效。后来微信读书评价果然还可以,有评价说看得出作者在NLP领域浸淫多年,这是不错的,有些东西光眼看不经历实际项目是没用的。其实我当时还看了微信读书的基本同类型书,有些书质量不错,但也有些拼凑感很重,都是网上到处整理的资料,果然,这些书的评论里就有不少人提到了,看来读者的眼睛是雪亮的。说回本书,其实我觉得整体还是太粗糙了,毕竟时间点紧,没太多时间打磨,内容呢也比较简单,是真的非常简单,毕竟是给非行业人士看的。我都跟业内人说你们别看,太简单了,不要浪费时间,当然更不要买,网上都有全书电子稿。

More

实时语音交互场景下RAG的机遇和挑战

这是2025年1月4日笔者受邀参加Zilliz举办的【向心力】系列会议《中美AI应用与落地分享》专场中的演讲,特此记录。

本文与演讲不完全相同,但核心内容一致。其中涉及到的内容还比较新,观点不一定准确,供参考交流。

这次分享的题目是《实时语音交互场景下RAG的机遇和挑战》,内容主要包括四个方面:主题引入、实时语音交互与RAG的结合、面临的技术挑战和未来的机遇与发展方向。

More