巨子 ICON - 財經股票資訊及專家分析
快訊
資訊
    虛擬市場
    專家

    快訊

    資訊

    97年的麻省理工輟學青年,五年成就73億美元獨角獸

    97年的麻省理工輟學青年,五年成就73億美元獨角獸

    從團隊到業務,Scale擁有一切硅谷寵兒的標籤:AI、API、YC、野心勃勃、年輕、才華橫溢、大學輟學創業、行業洞察。

    這幾年,硅谷有一家 SaaS 公司的表現非常亮眼,光看下圖的增長曲線,剔去我們熟悉的Slack、shopify、twillio,誰最橫?

    無疑是那條陡峭的橙色曲線——Scale。從0到估值73億美元只用了五年,ARR從0到1億美元只用了四年,Scale幾乎是SaaS公司裏最快達到這些數字的。

    髒活累活起家,Scale是無名之輩嗎?

    Scale所在行業無疑是當下最fancy的行業之一,人工智能(AI)和機器學習(ML)。想到人工智能,我們腦子裏可能都是科幻電影中那些能夠與人爭天下的機器人,但事實上,這個景象還離我們很遙遠,離身處於這個行業的Scale更是遙遠。

    Scale最初做的是這個行業最不性感、最接地氣、最能被稱為髒活累活的事情,即數據標註。

    所謂數據標註,就是企業客户,比如自動駕駛汽車公司,給到Scale一些圖片、視頻等等,Scale找一群人,給這些圖片和視頻打上標籤的過程。

    這裏的打標籤,不是我們理解的命名那麼簡單。舉個例子,Toyata和Lyft給Scale發送一張馬路上的圖片,如下圖,Scale就得找人把這些汽車圈出來,並且標註為「汽車」。

    (Scale官網)

    這個過程其實大家都很熟悉,我們經常在登陸驗證的時候被要求指出某些物體,比如下圖要求指出所有帶有船的圖片,即標註這些圖片:

    (網上截圖)

    你也許不會相信這世界上最性感而又高端的行業裏,有如此鼓譟的一環, 而這才是開頭那個具有靚麗增長曲線的Scale起家的業務。

    Scale由Alexandr Wang和聯創Lucy Guo創立於2016年的YC,當時這個公司還叫做Scale API,只是一家有API的土耳其機器人。

    土耳其機器人指的是亞馬遜的一個眾包平台,研究人員在網站上發布瑣碎任務,比如給圖像加標籤、進行調查、抄錄收據等,用户領取任務,在完成後能賺取少量現金。這聽起來是個人力驅動的公司,需要大量來自發展中國家的外包團隊,依靠經濟發展的不平等獲利。

    但目的比手段重要。

    塵埃裏的資本寵兒

    Scale的創始人Alexandr Wang出生於1997年,父母都是Los Alamos National Lab的物理學家。他的名字從Alexander去掉了一個e,因為父母想讓他的名字剛好有8個字母,8在中國代表着好運。他本身非常優秀,大學被麻省理工錄取,大一滿績,之後輟學。輟學之後,他先去了Addepar和Quora工作,也在Hudson River Trading也工作過一小段時間。

    2016年,他和另一名來自卡內基梅隆大學的輟學生Lucy Guo和Thiel的一名同事一起組隊,進入了YC2016春季營,其實當時的他也不清楚自己創業具體要做什麼,只是對市場痛點有一定的洞察。

    他曾描述道:「儘管麻省理工有數百名才華橫溢、天資過人的學生,但是沒有人用AI成功地構建任何東西。我們都在研究人工智能,卻都遇到了一大瓶頸——沒有好的數據。儘管如此,市面上也沒有可以解決這個問題的標準化工具,我們有AWS、Strip 和 Twillio,卻沒有任何人系統性地解決數據問題,這導致AI和ML的發展止步不前。」

    具體來說,他每天打開冰箱的時候,都會想在冰箱裏安裝一個攝像頭,攝像頭會告訴他什麼時候需要補充哪些雜貨,這聽起來並不難,但他根本做不到,因為沒有適用的數據工具。

    因此,他們決定做Scale。

    Alexandr確實精準地擊中了市場痛點,因此Scale發展地順風順水:

    2016年6月,Scale正式成立,YC投資了12萬美元換取公司7%的股份。

    2017年7月,Accel領投450萬美元A輪。

    2018年,完成1800萬美元B輪,同年,Scale進軍自動駕駛領域,並且拿下了許多行業內赫赫有名的客户,比如GM、Cruise、Lyft、Zoox和nuTonomy,標註的數據超過20萬英里。

    2019年8月,完成Founders Fund的Peter Thiel領投的1億美元C輪,跟投包括Accel、Coatue Management、Index Venture、Spark Capital、Thrive Capital、Instagram的創始人Kevin Systrom和Quora的CEO Adam d』Angelo。此時的Scale正式邁入獨角獸行列,估值十億美元。同年,Scale宣佈擴展行業領域,拿下了OpenAI和Lyft這種其他行業的頭部用户。

    2021年1月,以35億美元估值完成老虎基金領投的1.5億美元D輪融資,同時宣佈進軍標註之外的新業務,發布Nucleus。

    2021年4月,以超過70億美元估值完成來自Greenoaks Capital,Dragoneer和Tiger Global的3.25億美元E輪融資

    至此,可以說,Scale是個徹頭徹尾的資本寵兒。

    從團隊到業務,它擁有一切硅谷寵兒的標籤:AI、API、YC、野心勃勃、年輕、才華橫溢、大學輟學創業、行業洞察。

    Scale一掃早期的包工頭形象,儼然已經是一家性感的AI/ML公司。而相比其他AI/ML公司,它又不受「紅顏薄命」的詛咒,就連Peter Thiel都說:「在激烈的競爭中,AI公司們會出現又消失,但是Scale會一直存在。」

    那麼這樣的轉變原因是什麼呢?

    Peter Thiel一語中的:「因為Scale提供的是整個AI/ML行業的基礎設施,數據是這個行業最重要的東西。」

    AI/ML的基礎是數據,所謂的機器學習就是機器輸入並學習數據,從而輸出正確的編碼。沒有數據也就不會有ML或者AI,並且,不好的數據比沒有數據更加糟糕。學習一堆垃圾只會導致機器產出另一堆垃圾。

    可以說,數據標註是個普適性的需求,只要一個公司存在,它就有數據標註的需求。

    這個領域的領頭人Andrew Ng曾發推說:「AI系統=代碼+數據」,大多數的學術型競爭對手都不會去碰數據,而是在代碼上埋頭苦幹,但試想一下,如果有一個team可以不動代碼,光在數據上下功夫。」而這剛好就是Scale在做的事情。

    (Twitter/Andrew Ng)

    既然數據如此重要,為何沒有更有實力的巨頭躬身下場,拿下這塊香餑餑?

    前文也提到,數據標註是份髒活累活,受過良好教育的精英們寧可在代碼堆裏狂卷也不願意碰數據標註。巨頭不太可能在這個領域費心,他們的員工都太優秀了,不太可能把時間浪費在註釋上。這一點剛巧給到了早期的Scale足夠大的成長空間。

    始於數據標註,不止於數據標註

    當然,如果一直沉迷於數據標註,Scale無疑只是一家利用發展中國家便宜人力牟利的外包公司,何談科技?

    其實不然,儘管Scale的商業模型最初看起來更像是服務業,通過人工支撐起業務,但是隨着它自身數據的積累和模型的成熟,有些標註工作正在被機器取代。

    相比於最初的純人力驅動,現在Scale能讓算法和人工配合着去做數據標註。算法會先把視頻切成一幀一幀,並且粗略標註這些圖片,在這之後,人工會接過來做更精細的標註。由此,Scale在服務價格降低的同時,利潤率也在升高。

    同時,Scale在戰略上頗有遠見,他們從很早就計劃着從數據標註起家慢慢開發出一整套產品,讓這些產品協同作用,以更快的速度創建更好的模型和更好的結果。

    Alexandr Wang 認為,數據是ML和AI領域的基礎設施,因此數據標註只是個開始。Scale 的存在就為了通過建造最以數據為中心的基礎設施平台來加速AI應用的開發,它的核心信念是,數據就是新一代的代碼。Scale想做AI領域的AWS,支付領域的Stripe,數據分析領域的Snowflake。

    2020年1月,在完成D輪融資之後,Scale宣佈除了標註之外的新業務Nucleus。Nucleus是一個用於數據調試的SaaS工具,具體包括解讀數據、數據可視化、清洗數據和數據合作,從而幫助公司們建立更好的ML模型。

    圖源:Scale(Scale官網)

    Nucleus的推出使Scale開始得到一些長尾客户,並且拓展到更多行業。同年5月,Scale發布文檔產品Scale Document。

    Scale在完成了前五年數據標註積澱之後,一步一步把觸角伸向整個AI的生命周期,畢竟,數據標籤和數據生成只佔整個AI/ML基礎設施圖譜中的1/20。按照Scale的劃分(如下圖),AI的生命周期包括標註、管理、自動化、評估、蒐集、產生數據,這其中的每一步,Scale都要漂亮地拿下。

    AI的生命周期,圖源:Scale(Scale官網)

    在E輪融資過後,Scale正式宣佈其願景為「讓每個行業都能實現AI的應用。Scale為公司提供管理AI的整個生命周期的基礎,無論他們是否有自己的AI團隊,我們都會幫助他們建立AI策略,保證他們能夠擁有產出高效模型基礎設施。」

    這是一副極其宏偉的藍圖,回憶一下網路如何從一個小圈子擴展到如今萬物互聯,我們就可以想象,Scale的野心有多麼大。

    AI/ML基礎設施市場將在未來幾年內達到3000億美元。到2024年,預計Scale的數據標註的潛在市場份額能達到200億美元,光是Document和Nucleus的潛在市場份額就可以達到100億美元和80億美元。

    除了戰略遠見之外,Scale的內功也夠硬。

    和Stripe一樣,Scale很受程序們的喜愛,它把細節做得很好,「API非常好,有開源數據集、文檔很乾淨。」

    許多大客户用Scale也不單單是因為不想幹數據標註的活兒,而是因為Scale的人才密度更高,Scale的推特有一半都是在欣喜若狂地宣佈從哪兒挖了大牛,或者是組織了什麼集聚大牛的行業盛會。

    (Twitter/Scale)

    Scale 的 CTO 就是從 Amazon 挖過來的AI專家,而戰略負責人則是前美國國家首席技術官。

    (Twitter/Alexandr Wang)

    財務SaaS公司Brex也是Scale的客户,而在問及為什麼Brex不直接自己僱傭一個AI團隊時,其CEO Dubugras說:「他們擁有許多AI市場上最優秀的人才,而我不能只是打個響指就僱好一個優秀的團隊。AI工程師們也希望可以在解決領域內最難的問題的公司工作,Scale就是其中之一。」

    回望Scale短短的五年,它的故事像極了灰姑娘,看似毫不起眼,卻一路逆襲,骨子裏是對商業極度敏鋭的純正血液。

    我們期待着AI/ML領域的AWS,Twillio,Stripe,Snowflake的誕生。

    本文由《香港01》提供

    於本流動應用程式(App)或服務內所刊的專欄、股評人、分析師之文章、評論、或分析,相關內容屬該作者的個人意見,並不代表《香港01》立場。