AI正在创造全新的信息获取范式,Perplexity和ChatGPT等ToC的AI搜索应用,突破了谷歌在互联网早期定义的“十条蓝色链接”搜索引擎范式,让用户可以直接得到一个AI搜索信息后生成的高质量答案。
对于更专业的用户,OpenAIDeepResearch等研究类Agent,可以经过多轮的深度搜索,最终输出一份内容详实,真实可信的专业报告。
而在AI搜索应用背后,还有一个范式转移,那就是专为AI打造的搜索引擎,它们走在更前沿。它们的目标是提供一个对世界全面、无偏见、高质量的理解,能让AI搜索到过去找不到的东西。
近日,两家这种类型的公司接连获得了大额融资,其中Exa获得了Benchmark领投的8500万美元B轮融资,估值达到7亿美元,LightspeedVenturePartners,YCombinator和英伟达继续跟投。
You.com获得CoxEnterprises领投的1亿美元C轮融资,估值达到15亿美元。
信息获取和传播方式的范式转变,每一次都带来人类社会效率的大幅度提升,进而促进生产力的大幅提升。从文字的发明,纸张的发明,印刷术的革新,莫不如此。
人类进入信息时代的特征是互联网的发明和普及,而互联网时代真正提升人类信息获取效率的应用是搜索引擎。
在AI时代,怎么进一步提升人类的效率,信息获取的范式还能怎么改变?Exa和You.com这两家公司给出的答案是为AI打造搜索引擎,这个搜索引擎要比以往给人类设计的搜索引擎更快,更准。
就如ExaCEOWillBryk所说:搜索引擎像谷歌是为人类设计的,而不是AI。谷歌为人类的点击行为而优化,而AI需要的是一个足够强大和精准,能够检索出数千条包含最佳信息的搜索结果。AI只追求最高质量的知识,而非SEO*信息或广告。众所周知,输入的是*,输出的自然也是*。”
而You.com创始人RichardSocher也表示:“如果Bing找不到某个东西,那么AI搜索工具们普遍应用的SearchGPT(它依赖于Bing)也无能为力。因此,今天的所谓‘AI搜索’,主要是在节省时间,它并非一个真正更强大的搜索引擎。”
这些为AI设计的搜索引擎是给AIAgent使用的,而AIAgent是可以并行运行的,一个人可以同时管理数十个Agent,当搜索的质量和数量都提升时,信息获取的效率当然会相应大幅提升。
本质上,Exa和You.com都是AI原生的搜索基础设施,You.com创始人RichardSocher写道:“AI模型今天非常强大,但它们需要正确的基础设施才能充分发挥其潜力。这就像我们在拥有高速公路之前就造出了自动驾驶汽车。我们You.com正在建设的就是这些高速公路。”
但是在实现方式,产品形态和商业模式上,Exa和You.com却走了不同的路径。
Exa由一对哈佛校友WillBryk和JeffWang联合创立,它们是YC的早期孵化项目。
Exa的技术核心是一个自研的神经网络搜索架构,创始人WillBryk表示:“Transformer模型通常用于预测下一个词。而我们训练搜索引擎,是为了预测下一个链接。”其技术基于“向量数据库和嵌入技术”,而非传统的关键词匹配。
它的主要产品是专为AI设计的搜索API,定位为“AI世界的数据层”;具体来说,包括:用于快速响应的ExaSearchAPI;用于全面搜索的Websets;以及能执行多步研究并返回结构化洞察的researchAPI。
Exa的researchAPI在SimpleQA中取得94.9%的高分(来源:Exa)
在产品性能方面,Exa打造了全球最快(自称)的搜索API,响应时间低于450毫秒;它们的ResearchAPI端点在SimpleQA基准测试中取得了94.9%的高分。
用一句话来概括它的定位,那就是为AI打造的“纯粹知识源”。
在商业模式上,Exa向客户提供的是按使用量付费的搜索服务——摒弃广告,唯重质量。目前,Exa拥有Databricks、Cursor、Notion等头部用户。
Databricks利用Exa的技术来为其自身的模型训练寻找大规模的训练数据集;Cursor使用Exa来检索技术文档;而Notion则通过Exa为其NotionAI功能提供支持。
You.com由Salesforce前首席科学家RichardSocher和Salesforce的前AI研究主管BryanMcCann联合创立,在Salesforce期间,Socher帮助构建了公司庞大的EinsteinAI平台。
You.com的产品,最初并不是现在的形态。2021年它的初版产品仍然是传统搜索引擎,只不过它在UI上做了重大改变,它的搜索结果会按应用进行分类呈现,并且减少广告,提升了用户的使用体验。
当GPT-3等真正可用的大语言模型出现后,You.com推出了YouCode和YouWrite等功能,能够根据搜索查询,生成或者根据提示撰写论文、博客文章。
在这个时候,它还没有找到自己的最佳形态。
直到它探索出自己的最佳定位,一边为AI而非人类打造搜索引擎,一边推出ResearchAgent(2024年)以及真正的旗舰产品ARI(AdvancedResearch&Insights)时,它的融资开始顺利起来,在2024年和2025年分别获得5000万美元和1亿美元的B轮和C轮融资。
现在,You.com的核心技术是其“与模型无关(model-agnostic)的AI操作系统”,它能使任何大语言模型都变得更准确、更值得信赖。
在产品方面,它有面向开发者的可组合API基础设施,包括web和新闻搜索、深度研究、图像搜索、私有RAG系统等一系列能力。
面向企业,它则提供端到端完整解决方案,这个方案是深度定制的、能够直接解决业务问题的完整AI应用。
例如它的核心产品ARI(AdvancedResearch&Insights)是专为企业设计的尖端研究类Agent,它能即时生成包含可视化图表、带注释的对比分析以及交互式数据图的精美PDF报告。它的研究速度比ChatGPT快3倍,平均响应时间仅为3分钟,而且能同时处理超过400个信源。
You.com的产品ARI对比OpenAI的产品有76%的胜率(来源:You.com)
用一句话来总结,You.com构建了Agent时代的高速公路:一个能够整合多源数据、为任务择优选用模型,并以企业级规模交付精准、可信结果的平台。相比Exa更专注做开发者背后的工具,You.com则既提供工具,也为企业直接提供产品。
目前,You.com的客户包括DuckDuckGo、Windsurf、Harvey等AI时代的头部公司,每月处理超过10亿次查询。
Contextisking,对于企业客户来说,单纯的通用模型很难直接带来效益,尤其是当Agent成为主要产品形式。Agent想要自动为企业带来效益,需要高智能和高准确性,智能可以拆解为它对企业业务的深度理解;而高准确性解决的问题,类似于自动驾驶中的“最后一公里”问题。
假设一个Agent的每一步只有95%的准确率,那么任何一个包含30个步骤的工作流都无法可靠地运行,你必须将准确率从95%提升到99.9%。
要让Agent贴近业务,需要大量高质量的数据,这些数据指的是与企业的业务高度相关的数据。这些数据,可以由人工搜集起来,对通用模型进行后训练,让通用模型变成一个微调过的垂类模型。
另一方面,如果Agent具有超强的搜索能力,能够在企业内部和外部,实时搜索到足够多,足够高质量的数据,来为Agent/模型提供上下文(context),那么就有很大可能高智能和高准确性兼得。这项能力,对于AI应用走到各个垂类业务的深水区,非常重要。
AI时代的到来,让搜索领域有了颠覆性的创业机会,无论是打造针对人类的AI搜索应用,还是打造针对AI的搜索工具,都还有巨大机会,尽管已经出现了Perplexity这样的百亿美元独角兽,但是从产品体验和市场渗透率来说,这个领域还在早期。
再发散一下,进入2025年,各大模型公司推出的通用模型开始Agentic化,工具调用能力成为模型发展的重要方向,那么打造模型/Agent在工具调用时使用得最多的那几类工具,也是很好的创业方向。
此外,对于创业者来说,无论是打造搜索应用,还是其他的AI工具,既可以选择像Exa一样打造极致性能的工具,用技术和数据飞轮打造护城河;也可以像You.com这样既打造基础设施,也推出自研的应用,与客户的工作流深度绑定,用客户的粘性和迁移成本作为护城河。这些都可以根据自身的团队特点和业务方向来选择。
本文由阿尔法公社原创。