相信使命和生命同样重要。致力于用技术改善世界,用认知重塑思维。
长琴
AI 算法工程师;Agentic RL 时代的数据 × 范式 × 推理优化综合架构师。对深入研究和理解算法原理乐此不疲,并作为终生追求。
不追风口、只追长期。
用十年的尺度看一年的事,用工程师之手锤打技术、用哲学家之心追问意义。
心之所向、身之所往;虽有遗憾、并无后悔。
* 散落十年的句子收在这里:/slogan/。
【个人画像】
深耕一线的 AI 算法工程师 / 架构师。 有着非典型跨界背景:从经济学研究、到组织管理、再到全面转型算法。曾任 NLP 负责人与 CTO,但比起管理,更喜欢写代码和搞模型。目前依然坚持一线训推与开发,努力打造工业级高性能 AI 系统。
目前依然坚持一线训推与开发,努力打造工业级高性能 AI 系统。主要关注 LLM、RL、多模态及推理加速等方向,懂点语音,也懂点前后端,图像不太懂。会(上过生产)Python、Java、JavaScript、Elixir、一点 C++ 和 Rust。
期望成为模型后训练+推理优化+业务工程 综合架构师。核心宗旨:落地导向、全栈视角、问题解决。
【技术关注】
- LLM:上下文工程(压缩/超长/跟随)、模型架构、实时学习、自进化学习。
- 强化学习:Agentic RL、Embodied AI。
- 多模态:对齐、融合、语音、视频。
- 推理部署:蒸馏量化、异构计算、端侧推理。
【生活志趣】
- 读书:哲学、AI、计算机、编程、架构、经济、思维、科学、科幻、文学、历史、个人成长、运动健身等多个方面。
- 音乐:古典、史诗、摇滚、后摇、纯音。也弹吉他,会拉一点中提琴。
- 运动:跑步、健身、太极,各类球如足球、羽毛球、壁球、篮球、桌球、乒乓球,各类棋,各类牌。
开源项目
负责的开源项目和教程。
🚀 1. 前沿与核心 (Frontier & Core)
包含大模型微调、推理服务化工具,以及相关的底层实现剖析实战。
| 项目 | 类型 | 角色 | 简介 |
|---|---|---|---|
| hscspring/lightinfer | 工具 | 独立负责 | 将模型Inference转为HTTP Server |
| hscspring/promptlog | 工具 | 独立负责 | 提示词版本控制记录工具 |
| hscspring/hcgf | 工具 | 独立负责 | 简单易用的LLM微调工具 |
| hscspring/bytepiece-rs | 工具 | 独立负责 | Rust+Python版本的 Bytepiece Tokenizer |
| hscspring/llama.np | 算法 | 独立负责 | LLaMA推理纯NumPy实现 |
| hscspring/ALL4AI | 聚合 | 独立负责 | AI相关工具、项目集 |
| datawhalechina/HuggingLLM | 教程【开发】 | 负责人 | 蝴蝶书《ChatGPT原理与应用开发》视频 |
| datawhalechina/llm-cookbook | 教程【开发】 | 发起人 | 面向开发者的 LLM 入门教程,吴恩达大模型系列 |
| 百度 大模型应用开发技巧与实战 | 教程【开发】 | 负责人 | 大模型原理与应用开发范式 |
| 开放原子基金会 开源大模型入门 | 教程【开发】 | 负责人 | 大模型应用开发范式 |
| datawhalechina/llm-deploy | 教程【推理】 | 负责人 | 大模型/LLM推理和部署理论与实践 |
| datawhalechina/hands-on-llama | 教程【推理】 | 独立负责 | 以LLaMA为例基于NumPy介绍LLM推理相关知识 |
| 上海AILab InternLM/Tutorial | 教程【推理】 | 负责人 | 《书生·浦语大模型实战营》量化部署实践,视频 |
| datawhalechina/hands-on-llm | 教程【算法】 | 独立负责 | 从理论到训练再到上线全流程 |
| 魔搭 datawhalechina/sora-tutorial | 教程【算法】 | 负责人 | 《Sora原理与技术实战》Transformer解析,视频 |
🧰 2. 基础与筑基 (Foundation & Base)
包含自然语言处理底层工具、分词器实现,以及数据科学必备的框架库实战。
| 项目 | 类型 | 角色 | 简介 |
|---|---|---|---|
| hscspring/pnlp | 工具 | 独立负责 | 常用的NLP处理工具 |
| hscspring/cppjieba | 工具 | 独立负责 | 结巴分词的C++版本 |
| hscspring/hnlp | 工具 | 独立负责 | 一个易用的、开发中的传统NLP训练框架 |
| hscspring/Multi-Label-Text-Classification | 算法 | 独立负责 | 多标签分类 |
| hscspring/ptcls | 算法 | 独立负责 | Token分类 |
| hscspring/All4NLP | 聚合 | 独立负责 | NLP相关工具、项目集 |
| datawhalechina/巨硬的 NumPy | 教程 | 独立负责 | NumPy教程,视频:从小白到入门_哔哩哔哩_bilibili |
| 数据科学一级 -AI 学习 - 阿里云天池 | 教程 | 部分负责 | 阿里云天池《数据科学》NumPy 课程 |
🛠️ 3. 工程与应用 (Engineering & App)
包含全栈脚手架、并发控制库、网络请求工具,以及我独立开发上线的一些实用产品网页。
| 项目 | 类型 | 角色 | 简介 |
|---|---|---|---|
| hscspring/xhttpy | 工具 | 独立负责 | 大一统的HTTP/API请求工具 |
| hscspring/create-vibe-app | 工具 | 独立负责 | Vibe Coding脚手架 |
| hscspring/pararun | 工具 | 独立负责 | 脚本并发执行库 |
| hscspring/yoc | 应用 | 独立负责 | GitHub年度报告。国外 国内 |
| hscspring/toolhub | 应用 | 独立负责 | 好用的工具集合网站。国外 国内 |
| hscspring/SuitJOB | 应用 | 独立负责 | 根据岗位描述和要求匹配岗位。国外 国内 |
| hscspring/uuid-by-string | 工具 | 独立负责 | UUID生成 |
| datawhalechina/sweetalk-design-pattern | 教程 | 负责人 | 基于《大话设计模式》对设计原则和模式进行解读 |
🧠 4. 认知与成长 (Cognition & Growth)
| 项目 | 类型 | 角色 | 简介 |
|---|---|---|---|
| datawhalechina/daily-interview | 教程 | 部分负责 | 面经,包括机器学习,CV,NLP,推荐,开发等 |
开源社群
- 知乎专栏:
- Rust 中文社区日报编辑、专栏作者(已暂停)。
- Rust 日报:Search - Rust 语言中文社区
- Rust与AI 专栏:Search - Rust 语言中文社区
- Datawhale Paper 分享。
- 视频:Paper 分享
LLM 相关技术活动主讲嘉宾/评委
最近 4 条:
20260310飞书玩虾大会 GEEK 专场嘉宾:【飞行社】📚 🦞 玩"虾"大会 Day2-周二晚见20260308AI 黑客松高校联赛导师、评委:就在本周,邀你观战|嘉宾揭晓&观众招募开启20251121非凡 AI 百大创造先锋:AI Creators 100 - 飞书云文档20250923云栖大会魔搭 Agent 挑战赛评委:MCP&Agent 挑战赛
查看更早的活动记录
20250227嘉程资本创业流水席第 251 期:2 月 27 日,探讨 DeepSeek R1 技术解析与应用趋势!架构论文/技术影响/应用场景|嘉程创业流水席第 251 期20250225大工大创业沙龙第 111 期:DeepSeek 解密202502152025 iFLYTEK 开发者 TALK 杭州站:揭秘 DeepSeek 核心技术与应用构建 | 开发者 TALK 开年首站落地杭州,文章、PPT20240817OpenAIGC 第二届开发者大赛评委:顶峰相见,OPENAIGC 开发者大赛 8 月 17 日上海决赛开启!20231223早早聊:前端搞 AI | Datawhale X 早早聊喊你来玩转 AI 开发啦20231216讯飞星火 AI 开发者 TALK:携手知名开发者社区,畅谈大模型实际应用 | AI 开发者 TALK20231125苏州 GDG:2023 苏州 Devfest AI 专场预告 - 程序猿媛们在 LLM 浪潮中的新机遇20231104OpenAIGC 开发者大赛评委:初赛结果公示 & 决赛日议程 —2023 第一届 OPENAIGC 开发者大赛202310241024 浙江程序员节:【工作动态】2023 浙江程序员节活动预告
公开作品
- 《GarmentGPT: Compositional Garment Pattern Generation via Discrete Latent Tokenization | OpenReview》
- 蹭了一篇 ICLR 2026,基于之前的一些实验和讨论,始料未及。
- 《ChatGPT原理与应用开发》
- 《[2305.13246] Interactive Natural Language Processing》
- 《ChineseFLAN》
- 负责部分数据集。
- 地址:BAAI/COIG-PC · Datasets at Hugging Face