论文:High-Fidelity Audio Compression with Improved RVQGAN
代码:descriptinc/descript-audio-codec: State-of-the-art audio codec with 90x compression factor. Supports 44.1kHz, 24kHz, and 16kHz mono/stereo audio.
TS3-Codec
BigCodec
关于AI前沿的思考
《真希望父母读过这本书》读书笔记
周六下午和爱人一起去了天目里,散步、聊天、看风景、喝茉酸奶、吃烧鸟、去鸟屋书店读书、去饸饹面馆吃面。这是我们第二次去这里了,主要是那家面馆的面很符合我们口味,但也不能打车过去就吃个面,所以每次都要看一两个小时书。这本书就是这天我读的两本书之一,还剩最后一章没读完,我觉得问题不大,得赶紧把读过的记下来。
基础和取舍
没想到居然一年多没写这样思考性的文字了,ChatGPT后遗症有点大。去年底换工作再加上孩子出生,生活一下子变得异常充实了起来。家庭和育儿方面成长很多,从一开始的没耐心,到逐步理解包容、感同身受(无论对爱人还是孩子),一年不到时间改变了非常多。工作方面也取得了一些成果,强度和深度比此前所有工作都高了一个级别,虽然很忙,但非常开心。比较不满意的是过于忙碌导致没时间夯实基础,总感觉自己比较浮。正好国庆假期,重新整理一下思路。
MIO
Tiny LLM Continual Pre-training:RHO-1
LLM打街霸
国外的一个项目,看了一下比较简单,于是也拿过来玩儿一下。由于原项目没支持中文,就简单支持了一下,顺便简单地重构了一下代码。
- 代码地址(Fork):https://github.com/hscspring/llm-colosseum
- 项目原地址:https://github.com/OpenGenerativeAI/llm-colosseum