243 數據工廠(1 / 2)
路舟走後,陸銘回到了實驗室內。
他一邊走到後排,吩咐助手將新買的顯卡拆出來安裝。顯得要老舊點的是他從住所搬過來的GTX280,而大多則是微訊的員工送過來的英偉達最新型號GTX580。
去年DanCCiresan發表的論文堪稱震驚世人。論文中采用了GTX280來處理數層的神經網絡。而在此之前,神經網絡的發展是一直苦於CU的處理速度限製,而即便是要使用GU,也得為特定的問題製作特定的算法。
而說來讓陸銘覺得巧的是,路舟年前給他提這事還讓他頗為頭疼。但就僅僅幾天前,DanCCiresan新發布的論文提供了一種快速、可參數化的卷積神經網絡,這可當真是瞌睡了來枕頭。
當然,對陸銘來講麻煩事自然也有,比如數據集的問題、實習生的水平問題、最終實際應用的問題。
而這些都得靠時間一點點解決。
陸銘想了想就笑了起來,他是沒多大心態變化,反而是更加期待這接下來的工作。
反正天大的事也不是他陸銘頂著,這背靠著小學弟他也就安心研究便是。
兩周後,夢穀雲低調上線了眾包平台。
大多數關注到消息的網民第一反應,「?!」
盡管眾包的模式並不算新鮮,但讓人感到新鮮的在於眾包中的項目。
夢穀眾包分了數個欄目:語音轉文字、圖片轉文字、圖片標注和分類、臉部照片和視頻、腳部照片等。
前頭兩項按照提交的量計費,而後兩項則是一次計費。
有眼尖的互聯網從業者這就認出了這夢穀眾包模仿的是亞馬遜眾包。須知,著名的ige中就有大量來自亞馬遜眾包的數據集。
夢穀雲這是要搞事情啊?有沒這麼牛逼?
當然,外頭怎麼猜怎麼想是別人的事情。
一周後。
此時的路舟正在前往鄭市的飛機上。說來,這是他第一次去這城市。
路舟身邊是坐了夢穀推廣廣南分公司的經理周凱。身後的周達和王強東倒不是必要來的,不過是和周凱相熟一起合作所以也是跟了過來。
事情的倒也簡單,無非還是AI那點事,需要一些下遊的公司來處理一些業務。
在陸銘的實驗室研究項目開始運轉後,路舟先是安排了微訊向海天瑞聲購買了一批語音庫供陸銘研究使用。
海天瑞聲是早在98年開始就做著語音標注的業務。路舟所買下的語音數據庫,裡頭的結構可以看成是一段語音對應一段文字。這樣的庫被廣泛地用於訓練AI,做語音識別或者轉換等領域。
至於這些庫的源頭?那自然是人工聽取再標注出文字數據。
而有語音標注,自然就也有圖片、視頻。這些都被稱為數據標注。一個神經網絡搭建後,需要用到的訓練數據便大多是來自於這裡頭。
夢穀雲上線眾包或者路舟這次來鄭市的目的也在於此,找人,認數據,練AI。
至於裨益,那簡直是全方位的。幾乎所有夢穀內的產品都能有所獲益。
「周凱。」
「老板請講。」
路舟擺了擺手,「叫我路舟吧還是。說說,你是怎麼就這麼大膽公司剛上眾包一個月,你這就敢拉起工作室來搞的?」