Hugging Face:一个YC淘汰项目的意外逆袭
2016年,三个法国年轻人做了一个聊天机器人App,在YC面试中被拒。两年后,他们开源了自己的NLP模型,这个决定意外开启了AI开源革命。
Hugging Face:一个YC淘汰项目的意外逆袭
2016年冬天,三个法国年轻人在纽约曼哈顿的一间小公寓里,面面相觑。他们刚刚收到了Y Combinator的拒绝信——那个全球最著名的创业孵化器,拒绝让他们入驻。
“我们被告知,这个聊天机器人没有足够的商业潜力,” 联合创始人Julien Chaumond后来回忆道,“但我们觉得它很有趣。”
这个被YC淘汰的项目,叫做Hugging Face。
一切从一个emoji开始
Clement Delangue、Julien Chaumond和Thomas Wolf,三个在法国高等理工学院相识的年轻人,2016年决定一起创业。他们的第一个产品,是一个面向青少年的聊天机器人App。
名字来自那个双手展开的emoji——🤗。他们希望做一个 friendly 的AI伴侣,可以聊天、讲笑话、模拟各种角色。
这款App确实吸引了一些用户,但增长缓慢。更重要的是,三个创始人意识到一个问题:让聊天机器人理解对话太难了,当时的技术远远不够。
“我们发现自己在解决一个10年后才能解决的问题,” Thomas Wolf说。于是,他们开始把内部开发的NLP模型上传到GitHub,供研究社区免费使用。
一开始只是资源共享——把自己训练好的模型分享出去,方便研究者复现实验结果。但意外的事情发生了。
那个意外的决定
2018年,一个重要的决定摆在他们面前:是否要开源整个模型库?
彼时的AI界,大公司把模型视为核心资产。Google有BERT,OpenAI有GPT,没有人会把这些”皇冠上的明珠”免费送人。
但三个法国人做了一个看似”疯狂”的决定:他们要把所有训练好的模型都开源。
“我们当时想,反正也没人用我们的App,不如让技术更有价值,” Clement在一次采访中坦言。“如果我们不做点什么,这些模型就只是硬盘里的bits。”
他们把模型上传到一个叫做”Model Hub”的地方,任何人都可以下载、使用、微调。最初,这只是一个极简的Git仓库加上一个简单的Web界面。
然后,奇迹发生了。
星星之火
2018年底,Google发布了BERT——一个革命性的语言理解模型。整个AI社区为之震动,但很快,研究者们发现一个问题:如何使用这个模型?
BERT的论文很精彩,但把它变成可运行的代码,需要大量工程工作。
这时,有人发现了Hugging Face。他们已经把BERT做成了可即插即用的Python库,输入几行代码,就能加载一个预训练模型。
消息在Twitter和GitHub上传播。研究者们开始涌入,Star数从几百到几千,再到上万。Hugging Face从一个被遗忘的聊天机器人App,变成了AI研究者必备的工具。
“我们完全没想到会这样,” Julien说。**“我们只是想做个好用的东西。”
到2019年,Hugging Face的模型库已经收录了超过1000个预训练模型,涵盖50多种语言。这个数字在2020年突破了10000,2022年超过了200000。
20亿美元的逆袭
2022年5月,Hugging Face宣布完成1亿美元C轮融资,估值达到20亿美元。从YC淘汰项目到AI界最具价值的开源平台,只用了四年。
“YC拒绝我们是对的,” Clement在融资后发推特写道。“我们的产品确实没有商业潜力。但我们开源的模型库有。”
这个故事最讽刺的转折在于:当年YC拒绝他们的理由——“没有足够的商业潜力”——恰恰成就了Hugging Face的独特价值。当你不急于变现,反而能聚集整个社区的力量。
今天的Hugging Face,拥有超过100万星标,托管了超过35万个模型,成为全球最大的AI模型开源平台。Google、Meta、Microsoft都在这里分享他们的最新模型。
而那三个被YC淘汰的法国人,用一种最意外的方式,证明了自己。
“YC告诉我们,这个产品没有商业潜力。他们是对的——我们的产品确实没有。但我们开源的东西有。这大概是创业最有趣的地方:你永远不知道哪个押注会带来回报。”
— Clement Delangue,Hugging Face联合创始人兼CEO