
智东西10月21日报道,今天,据The Information援引知情人士报道,OpenAI的日本竞对Sakana AI被曝将以25亿美元(折合人民币约178亿元)估值筹集1亿美元(折合人民币约7亿元),相比去年9月的15亿美元(折合人民币约107亿元)估值增长66%。
知情人士透露,Sakana AI正在与美国和日本投资者进行谈判,筹集这笔1亿美元新资金后,Sakana AI的估值将达到26亿美元(折合人民币约185亿元),该公司计划利用新资金扩大其工程、销售和分销的员工团队,它现在有大约70名员工。

▲Sakana AI创始人Llion Jones(左)、David Ha(右)
这家创企与OpenAI、Anthropic等企业所选择的路线不同,其希望抛弃Transformer架构,以自然进化为灵感降低模型计算成本并提升模型性能。在产品进展方面,该公司已经发布三款日语模型、江户古风聊天机器人Karamaru以及开源框架ShinkaEvolve。
Sakana AI在日语中意为鱼,Ha此前告诉The Information,他打算建立一个“日本的DeepMind”。
Ha透露,其算法可以帮助企业自动创建处理语言或图像的大模型,实现方法是在组合、测试和丢弃数据时模仿自然选择的规律,从而减少所需的人工输入量。这是因为训练大模型所需的电力或资源量消耗巨大的,他希望将这段时间缩短到几天或几周。
具体来看,Sakana AI采用的算法是将三种开源原始AI模型作为“父母”,通过不同方式“养育”超百名”子女”,接着选出表现最优的模型再生成下一代,然后不断重复这一过程,创造出数百代模型后选出佼佼者。
今年3月,SakanaAI发布三款日语模型,分别是大语言模型EvoLLM-JP、视觉语言模型EvoVLM-JP和图像生成模型EvoSDXL-JP。
时隔一月,Sakana AI发布江户古风聊天机器人Karamaru,这个聊天机器人可以用江户时代的世界观和当时的古代文献来回答用户,其训练数据来自该公司从江户时代书籍中建立的包含约2500万个字符的数据集。
今年9月,Sakana AI开源了ShinkaEvolve,该框架将大模型与一种算法相结合,帮助其针对各种潜在问题提出解决方案,并缩小到最相近的问题。该公司声称,与Transformer架构相比,这种方法更高效,更能提出创造性的解决方案。

▲ShinkaEvolve框架概述
今年5月,它宣布与三菱日联金融集团建立多年合作伙伴关系,为日本最大的银行开发定制AI模型。这笔交易达成后,Ha告诉外媒,这将使Sakana AI在一年内实现盈利;本月早些时候,Sakana AI宣布与日本最大的券商之一大和证券集团建立类似的合作伙伴关系。
Ha提到,日本每家想要拥有自己的基础模式的公司都可以与Sakana AI或其他像Sakana AI这样的公司合作开发自己的模式,日本还有成为创新者的空间。
今年2月,OpenAI宣布与软银建立合作伙伴关系,软银同意每年为自己及其子公司花费30亿美元(折合人民币约214亿元)购买OpenAI的技术,软银和OpenAI还将成立一家合资企业,专门向日本公司销售OpenAI工具套件;Anthropic在今年8月任命了日本国家负责人,并准备在日本东京开设办事处;今年8月,加拿大大模型创企Cohere聘请了一名日本国家经理。
