跳到主要內容

小米如何挖到語音大牛 Daniel Povey?


Daniel Povey 在小米,圖源:崔寶秋微博


  上周 AI 圈的一則重磅新聞是 Daniel Povey 宣布將加盟小米,這位語音界的大牛、Kaldi 之父先是被任教的約翰霍普金斯大學開除,后收到 Facebook 的橄欖枝,結果他選擇拒絕 Facebook 的 offer,來中國工作。


  挖到了這位國際大牛後,小米不失時機地在 10 月 23 日舉行了一次人工智能媒體開放日活動,對外分享小米的人工智能布局,以及被 Povey 看中的過程。


  這是小米今年 2 月調整組織架構,將人工智能業務拆分為獨立事業部后的首次對外開放活動。與會的包括小米集團副總裁、技術委員會主席崔寶秋博士,小米集團人工智能部總經理恭弘=叶 恭弘航軍博士,小米集團 AI 實驗室主任王斌博士。



Daniel Povey Twitter 宣布將加盟小米


  "面試"完看工位、看代碼


  Povey 被約翰霍普金斯大學開除后(原因比較奇葩,具體請看《怒拒 Facebook 后,語音識別大牛、Kaldi 之父將加盟小米》)收到 Facebook 的 offer,但他在 Twitter 上表示要拒掉 Facebook 的 offer,去一家中國公司工作,當時還沒有確定是要去哪家。


  據恭弘=叶 恭弘航軍介紹,當時這個帖子被小米人工智能部門語音組的負責人看到了,因為語音組一直在用 Kaldi,所以對他一直非常關注。



然後馬上就轉給我說這個人居然說要去中國公司工作,是不是咱們可以跟他聯繫一下,我馬上就轉給寶秋總,也給了我們國際招聘的同事,同事馬上就給他寫了封信,當天晚上 Dan 就回信了。



  這有點出乎小米的意料,因為小米在學術界發聲並不多。



後面又問了一些技術問題,第二封信是我來寫的,我把他問的一些問題,包括小米到底招他過來要做什麼,小米的戰略是什麼,小米怎麼看待開源的,簡單的回答了一下。再往後他又問了一些別的問題,後面就是寶秋總跟他聯繫。他說他本來就有計劃來北京訪問,我們說既然如此,來總公司大家互相認識一下。



  之後 Dan 就來了小米新總部"面試",先是小米的人給他介紹公司在做的一些事情,對開源的看法,聊完后他覺得挺感興趣的,突然提出要看看小米的工位。


  Dan 到工位看了后說,"你們代碼給我看一下",看了代碼后又問了些問題。恭弘=叶 恭弘航軍覺得機會大增,"看起來還是很喜歡我們這邊的環境",他說。


  談 offer:看重開源和生態



  作為小米技術委員會主席的崔寶秋在引進 Povey 的過程中也扮演了重要角色。他此前在微博上宣布 Povey 入職小米的消息收穫了超過 3000 的點贊和 1000 評論。


  Povey 來中國有個兩周的之旅,訪問了好幾家大學,包括清華北大上海交大,也訪問了很多頂級的互聯網企業。之所以選擇小米,崔寶秋認為主要有三點原因:


  一、小米的 AIoT 生態。Povey 在訪問小米的時候,崔寶秋為他詳細介紹了小米的 AIoT 生態,"小米的 IoT 智能聯網設備對外公布的數量是 1.96 億台,光這個数字就有足夠的說服力,生態有多麼強大,這裏面所有的東西都可以通過語音來控制。"他說。


  二、小米對自研技術和人才的重視。Povey 原來在學校,理論上更傾向於繼續在學術界,"他說後來想了想到學校吸引不到這麼多優秀的工程師。"崔寶秋說。Povey 在小米時重點看了工作環境,包括編程環境,GPU 使用率高不高等。


  三、小米對開源的擁抱。Povey 特別喜歡技術,在談 offer 的過程中,他對其它東西都不是很在乎,"他說他想寫一條,就是要保證 Kaldi 開源系統百分之百開源。我說這一條對我來說不是個問題,根本不是個事情。"崔寶秋回憶道。


  崔寶秋認為小米的開源戰略是吸引 Povey 的一個關鍵點,他在給 Povey 的 3 個 PPT 中專門介紹了小米對開源的擁抱。其中一個 PPT 談到將來的計劃,有一個就是要聯合中國的互聯網企業技術企業,來把中國的開源力量推向世界。Povey 將這句話專門標出來,說這就是他想做的。


  小米的人工智能布局


  雷軍提出小米未來五年的"雙引擎"是手機 +AIoT,其中 AIoT 是 AI 和 IoT 的結合,可見人工智能在小米整體戰略的重要性。


  為更進一步突顯 AI 戰略,小米還在今年 2 月將人工智能業務拆分成獨立事業部。本次活動上,小米也首次對外詳細介紹了其 AI 布局。



小米 AI 能力圖譜,圖源:雷鋒網(公眾號:雷鋒網)


  小米在聲學、語音、視覺、自然語言處理、知識圖譜和機器學習這 6 大方向都有相應的研發團隊。團隊主要在北京和武漢,以北京為主,其中語音和視覺的團隊規模已經比較可觀,但具體的人數和團隊分佈官方表示暫無法透露。



小米聲學和語音能力,圖源:雷鋒網


  聲學和語音在這次活動上放在了一起講,王斌介紹了小米在這方面的一些研發成果:



  1. 在分佈式聲學、多場景語音技術方面,達到了行業領先水平。

  2. 六麥陣列、就近喚醒、協同放音、音效處理等技術已在多款小米產品落地,同時建成國內首家全自動遠場聲學實驗室。

  3. 小米遠場聲學測試規範被確立為中國人工智能產業聯盟聲學測試標準。

  4. 小米自研的語音識別、合成、語音喚醒和聲紋識別等關鍵技術也已經落地在手機、電視、音箱等眾多小米產品。


  值得一提的是,一開始小米 AI 音箱的聲學和語音技術來自合作夥伴,現在已經改為自研。



小米自然語言和知識圖譜能力,圖源:雷鋒網


  除此之外,王斌還介紹了小米在視覺、NLP、知識圖譜、機器學習等技術上的進展。視覺方面,自研的人臉識別、美顏、魔法換天、場景識別在多款手機上落地應用。小米已經打造了自己的 NLP 平台和知識圖譜,全面支撐公司的多項內容業務。小米面向移動端的深度學習開源計算平台 MACE(Mobile AI Computer Engine)目前廣泛用於公司的各項產品中。


  崔寶秋在談到 AI 在小米的應用時表示,作為一家互聯網公司,小米的所有產品,包括硬件產品、軟件產品和互聯網服務都需要 AI 來賦能,"今天 AI 在小米已經無處不在,這也充分表明了 AI 在小米整個生態系統中的重要性。"

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理

【精選推薦文章】



高價收購3C產品,價格不怕你比較



收購3c瘋!各款手機、筆電、相機、平板,歡迎來詢價!



公開收購3c價格,不怕被賤賣!



Orignal From: 小米如何挖到語音大牛 Daniel Povey?

留言

這個網誌中的熱門文章

有了四步解題法模板,再也不害怕動態規劃!(看不懂算我輸)

導言 動態規劃問題一直是算法面試當中的重點和難點,並且動態規劃這種通過空間換取時間的算法思想在實際的工作中也會被頻繁用到,這篇文章的目的主要是解釋清楚 什麼是動態規劃 ,還有就是面對一道動態規劃問題,一般的 思考步驟 以及其中的注意事項等等,最後通過幾道題目將理論和實踐結合。 什麼是動態規劃 如果你還沒有聽說過動態規劃,或者僅僅只有耳聞,或許你可以看看 Quora 上面的這個 回答 。 How to explain dynamic 用一句話解釋動態規劃就是 " 記住你之前做過的事 ",如果更準確些,其實是 " 記住你之前得到的答案 "。 我舉個大家工作中經常遇到的例子。 在軟件開發中,大家經常會遇到一些系統配置的問題,配置不對,系統就會報錯,這個時候一般都會去 Google 或者是查閱相關的文檔,花了一定的時間將配置修改好。 過了一段時間,去到另一個系統,遇到類似的問題,這個時候已經記不清之前修改過的配置文件長什麼樣,這個時候有兩種方案,一種方案還是去 Google 或者查閱文檔,另一種方案是借鑒之前修改過的配置,第一種做法其實是萬金油,因為你遇到的任何問題其實都可以去 Google,去查閱相關文件找答案,但是這會花費一定的時間,相比之下,第二種方案肯定會更加地節約時間,但是這個方案是有條件的,條件如下: 之前的問題和當前的問題有着關聯性,換句話說,之前問題得到的答案可以幫助解決當前問題 需要記錄之前問題的答案 當然在這個例子中,可以看到的是,上面這兩個條件均滿足,大可去到之前配置過的文件中,將配置拷貝過來,然後做些細微的調整即可解決當前問題,節約了大量的時間。 不知道你是否從這些描述中發現,對於一個動態規劃問題,我們只需要從兩個方面考慮,那就是 找出問題之間的聯繫 ,以及 記錄答案 ,這裏的難點其實是找出問題之間的聯繫,記錄答案只是順帶的事情,利用一些簡單的數據結構就可以做到。 概念 上面的解釋如果大家可以理解的話,接    動態規劃 算法是通過拆分問題,定義問題狀態和狀態之間的關係,使得問題能夠以遞推(或者說分治)的方式去解決。它的幾個重要概念如下所述。    階段: 對於一個完整的問題過程,適當的切分為若干個相互聯繫的子問題,每次在求解一個子問題...

計算機本地文件快要滅絕了

   編者按: 文件是数字世界的基石,是我們基本的工作單位。但是,隨着互聯網的雲化、平台化、服務化,文件日益變得可有可無。這樣一種改變究竟好不好呢?喜歡懷舊的 Simon Pitt 開始回顧各種文件的好處,哪怕這讓他顯得不合時宜。原文發表在 medium 上,標題是:Computer Files Are Going Extinct   我喜歡文件。我喜歡對文件重命名、移動、排序,改變它們在文件夾中的显示方式,去備份文件,將之上傳到互聯網,恢復它們,對其進行複製,甚至還可以對文件進行碎片整理。作為信息存儲方式的一種隱喻,在我看來文件是很出色的。我喜歡把文件當作一個工作單位。如果我要寫篇文章,文章會放在文件裏面。如果我要生成圖像,圖像會保存進文件裏面。    謳歌 files.doc   文件是擬物化的。這是個很花哨的詞,只是用來表示文件是反映現實物品的一個数字概念。比方說,Word 文檔就像一張紙,躺在你的辦公桌上(desktop)。JPEG 就像一幅畫,等等。它們每個都有一個小圖標,圖標的樣子看起來像它們所代表的現實物品。一堆紙,一個畫框,一個馬尼拉文件夾。真的挺很迷人的。   我喜歡文件的一點是,不管裏面有什麼,跟文件的交互方式總是一致的。我上面提到的那些東西——複製、排序、碎片整理——我可以對任何文件進行那些處理。文件可能是圖像、遊戲的一部分、也可能是我最喜歡的餐具清單。碎片整理程序不在乎它是什麼。它不會去判斷內容。   自從我開始在 Windows 95 裏面創建文件以來,我就一直都很喜歡文件。但是我注意到我們已經開始慢慢地遠離把文件當作基本工作單位的做法。 Windows95。我的計算機    services.mp3 的興起   十幾歲的時候,我開始痴迷於收集和管理数字音樂:我收藏 MP3 文件。一大堆的 128 kbps MP3 文件。如果你足夠幸運,有自己的 CD 刻錄機的話,就可以將它們刻錄到 CD 上,然後在朋友之間傳遞。一張 CD 可以容納 700 MB。這相當於將近 500 張軟盤!   我會仔細端詳我的收藏,然後煞費苦心地給它們添加上 IDv1 和 IDv2 音樂標籤。隨着時間的流逝,大家開始開發可以在雲端自動獲取曲目列表的工具,這樣你就可以檢查和驗證 MP3 的質量。有時候我甚至會去聽那些該死的東西,儘管...

純電動 Mini Cooper SE 將成為中國國產車,年產 16 萬輛

BMW 集團與中國長城汽車合資,將於江蘇建立新廠,專門投入生產 MINI Cooper SE 和部分長城品牌電動車,預計於 2022 年完工並投入生產,每年將可生產 16 萬輛電動車。 靈動可愛的 Mini Cooper,在許多車迷心中都有著特殊的地位,今年 7 月發表了首款純電動版本的 Mini Cooper SE 之後,獲得熱烈迴響,預訂數量已接近 8 萬台,顯示大家對於純電 Mini 的熱愛,因為油電版的 Mini Cooper Countryman 的全球總銷售量也才 3 萬出頭。 Mini Cooper SE 之前公布了官方定價,最低從 27,900 歐元起算,美國售價約 29,900 美元。相比現有的三門款,只貴了一成左右。然而,三年後,中國消費者將有機會買到最便宜的電動 Mini。 電動 Mini Cooper SE 最低價是 27,900 歐元,扣掉全額補助最低可以到 24,400 歐元。 BMW 集團與中國長城汽車集團於 2018 年宣布,將組建合資公司光束汽車,投入在中國的電動車生產計畫,而現在他們正式宣布啟動計畫,於江蘇張家港打造一個新工廠,全部投入電動車的製造,包括了 Mini Cooper SE 和其他長城汽車旗下的電動車。 目前的電動 Mini 只在英國牛津工廠製造,不難想像當產能轉移到中國後,Mini Cooper SE 的價格將有機會進一步調降,來競爭全球最大的電動車市場。這座屬於合資公司光束汽車的新工廠,採用一個新的產銷模式,由 BMW 和長城共同合作開發、設計、製造新產品,但是銷售通路完全沿用原本的品牌渠道。 換句話說,2020 年到 2022 年銷售的電動 Mini,將會是英國製造,而 2022 年後就會有中國製造版本開賣,考量到 Mini 在中國每年約有 30 萬輛的銷售額,同時油電版的 Coutryman 銷量更佔了全球將近五分之一,無怪乎 BMW 會想在最接近主要市場的地方蓋工廠囉。 外型完美復刻油車版 最後,簡單介紹一下 Mini Cooper SE 這台車。Mini 在電動化的路上,盡力保持著跟經典造型一致的設計,畢竟大家愛的就是它的設計。電動版的 Mini 車頭、車身跟車屁股都多了一個黃色的插頭標誌,車頭的氣壩則變成封閉式設計,除此之外,幾乎看不出來差別,連馬達...