玉林实硕医疗科技有限公司

00后華人大模型創(chuàng )業(yè),組隊7人挑戰langchain,硅谷頂級創(chuàng )始人給了天使投資

沒(méi)錯,Cortex就是這樣一個(gè)項目,被曝還拿下了Zoom系,Getty家族和快手系的天使投資。

這是一個(gè)集成諸多大模型API后,讓大模型更懂你的中間件。


(資料圖片僅供參考)

主打特色有二:

一是外接私有數據,包括Notion、Slack、Google Drive等,做特定領(lǐng)域的私有版GPT;

另一件事是在每個(gè)企業(yè)內部,打造千人千面的Copilot。

這個(gè)工具在國外已經(jīng)小小火了一把,目前擁有10多家付費用戶(hù)和上千個(gè)人用戶(hù)。

還有家網(wǎng)紅SaaS公司用上了Cortex,讓網(wǎng)紅們以特定的人設,和粉絲們激情熱聊。

所謂大模型中間件,是在底層大模型和上層應用之間的基礎軟件,主要解決大模型落地過(guò)程中,集成數據、應用、知識庫,以及大模型融合級功能協(xié)同這些問(wèn)題。

比較適合那種正面臨兩難境地,又想在大模型領(lǐng)域試水的旁友們:

自己造一個(gè)通用大模型,又貴又麻煩;那單純訓更垂直的行業(yè)大模型,或者調用別人家的大模型的API呢?好像又有些不夠用。

這個(gè)時(shí)候,中間件帶著(zhù)解決方案閃亮登場(chǎng)了。

隨著(zhù)大模型領(lǐng)域的愈發(fā)深入,大模型中間件的創(chuàng )業(yè)項目也先后冒了出來(lái)。能入硅谷頂級創(chuàng )始人青眼,Cortex憑借的是什么?

Cortex能夠做什么?

Cortex,可以將GPT-4等多個(gè)不同的大模型組合使用,實(shí)現語(yǔ)言模型之間的協(xié)同應用。

也就是說(shuō),它是個(gè)大模型應用層的編排器。

主要目的是提高技術(shù)人員開(kāi)發(fā)的“可拓展性、可訪(fǎng)問(wèn)性和效率”。

之所以叫Cortex,是取這個(gè)英文單詞“大腦皮層”的意思。

大腦是神經(jīng)中樞,可以看做大模型,而皮層就是大腦上面的結構。

它能做的事情,就是按需調用不同的大模型,并用固定的格式來(lái)限制輸出的自由度,從而幫助用戶(hù)做些單一大模型解決不了,或自己調用多個(gè)大模型API會(huì )比較麻煩的事情。

具體而言,它的功能主要是以下兩方面:

第一,作為集成許多API的工具,外接私有數據庫,“指哪兒打哪兒”地變成一個(gè)專(zhuān)一領(lǐng)域大模型。

從這個(gè)角度來(lái)看,Cortex走的是既“廣”又“深”的路子。

廣,是說(shuō)Cortex不與個(gè)別行業(yè)服務(wù)競爭,而是可以每個(gè)領(lǐng)域都用它練出大模型應用。

深,是說(shuō)在大模型通用知識基礎上,可以接入私有數據庫,加深對領(lǐng)域或用戶(hù)企業(yè)本身的理解。

為了讓這個(gè)專(zhuān)一領(lǐng)域大模型更實(shí)用,Cortex會(huì )采取調用向量數據、實(shí)時(shí)聯(lián)網(wǎng)搜索、調用指定API等方式。

Cortex的第二個(gè)功能,是能幫助每個(gè)人打造一個(gè)私人copilot。

基礎層面的工作,如撰寫(xiě)草稿、制作PPT、編寫(xiě)電郵、總結會(huì )議、查詢(xún)網(wǎng)購退貨方式,Cortex都能搞定。

進(jìn)一步的,在同一公司內部,喂給它一份原始的信息,Cortex也能獲取每個(gè)人崗位所需要的關(guān)鍵點(diǎn),并以特定格式輸出,即根據業(yè)務(wù)部門(mén)的不同而“千人千面”。

據了解,Cortex的費用根據實(shí)際使用量計算。

就計費方式和服務(wù)模式而言,Cortex似乎可以類(lèi)比為鏈接數據庫和大模型的“云廠(chǎng)商”,聚集多種多樣的API資源后,保證所有的功能都能一直運作,提供相關(guān)服務(wù)。

也因為如此,Cortex還蠻受開(kāi)發(fā)人員的歡迎——Cortex主要面向的就是有一定技術(shù)基礎的開(kāi)發(fā)者和IT從業(yè)人員,他們可以很快上手,大大減少從調試開(kāi)始的工作量,節省時(shí)間去做更有創(chuàng )造性的事情。

對不擅長(cháng)寫(xiě)prompt的程序員格外友好

為什么會(huì )選擇做這樣一個(gè)功能的大模型中間件?為了弄清楚答案,量子位聯(lián)系了Cortex背后的團隊。

他們給出的答案是,因為相信未來(lái)一定是一個(gè)多模態(tài)、多模型的世界。如果只有一個(gè)模型,哪怕強大如GPT-4,也無(wú)法搞定所有問(wèn)題。

他們認為,必須“把多個(gè)模型聯(lián)系在一起,才能組織一個(gè)真正的AI應用”。

而這樣的功能實(shí)現,在團隊核心成員初期想用Langchain去做的時(shí)候,“越做越發(fā)現非常困難”,AI領(lǐng)域目前缺少一個(gè)幫助模型層和應用層磨合的中間件來(lái)完成它的建設。

Cortex背后團隊的創(chuàng )始成員Nemo Yang對量子位表示:

不管已有的平臺還是工具能夠提供的能力,都無(wú)法很好地滿(mǎn)足這樣的idea。

團隊最初也走過(guò)其他路子,但隨著(zhù)對領(lǐng)域的了解,聽(tīng)到越來(lái)越多的用戶(hù)反饋稱(chēng),大模型挺好用的,但是出一個(gè)厲害的大模型就要接入一個(gè)API太過(guò)麻煩,對大模型調控性的掌握也比較困難。

受到這樣的啟發(fā),Cortex才逐步打磨成了今天的樣子。

Cortex的成形大概離不開(kāi)用戶(hù)對市場(chǎng)現狀的一個(gè)反饋,在與量子位的交流中,Nemo反復多次提到“用戶(hù)說(shuō)”“市場(chǎng)反饋”這樣的字樣,然后解釋Cortex是如何根據這些信息來(lái)捏出產(chǎn)品的特點(diǎn)的。

比如隨著(zhù)大模型大火而愈發(fā)走到眾人面前的向量數據庫,就有市場(chǎng)反饋如果對上下文關(guān)聯(lián)很強的文章進(jìn)行向量分割,檢索匹配后返回的答案,可能因為痛失對上下文的理解而“不知所謂”。

根據這一點(diǎn),Cortex調用的向量數據庫是完全自研的,可以根據需要全局檢索,也可以選擇一段一段地部分返回。

再比如,身為團隊里“語(yǔ)文底蘊最好”的人,Nemo實(shí)操下來(lái)還是覺(jué)得,對程序員來(lái)說(shuō),prompt engineering看上去簡(jiǎn)單,其實(shí)要出色完成并不容易。

所以Cortex有個(gè)設計對不擅長(cháng)撰寫(xiě)prompt的開(kāi)發(fā)者極其友好:

能夠讓擅長(cháng)寫(xiě)prompt的同事啥的,加入工作流程,讓Cortex更清晰地了解你需要什么。

之后還會(huì )有什么功能上新呢?

Nemo介紹,接下來(lái)大概率會(huì )接入Slack confluence、 Microsoft全家桶、 Google全家桶等。

一切為了一個(gè)最終目的,那就是Developer first,盡可能減少開(kāi)發(fā)者的開(kāi)發(fā)周期。

團隊介紹

Cortex背后的公司叫做Kinesys AI,目前團隊7人全職,2名創(chuàng )始人均為華人,多人從斯坦福本碩畢業(yè)。

創(chuàng )始人兼CEO,Nemo Yang,00后,花了2年時(shí)間,拿下佐治亞理工學(xué)院本碩學(xué)位,ML出身,之前在字節飛書(shū)和微軟工作過(guò)。

14歲的時(shí)候,Nemo就因為喜歡計算機,只身前往硅谷留學(xué)。高中起,他開(kāi)始寫(xiě)網(wǎng)站和App,參與過(guò)startup的開(kāi)發(fā)工作。

聯(lián)合創(chuàng )始人兼CTO,Jian Cai,畢業(yè)于北京大學(xué)計算機系,曾在Google工作8年。

他的上一份創(chuàng )業(yè)項目是在線(xiàn)協(xié)作辦公文檔“一起寫(xiě)”,后來(lái)被快手收購。

關(guān)鍵詞: