小米開發(fā)者大會三大關鍵詞:相機影像、小愛同學和AIoT

韓璐
據悉,目前使用小米智能設備的用戶已超3600萬,設置智能互聯場景的用戶達900萬,每天使用智能掃地機器人的家庭超過400萬,小米的智能門鎖守護了超過200萬個家庭的安全。

今天,小米開發(fā)者大會正式召開。

大會上,雷軍立下工程師擴增5000人新目標,并帶來了小愛同學5.0版本等6大最新技術成果,以及一個“重磅發(fā)布”。

“相機影像技術”貫穿全場,伸縮式大光圈鏡頭創(chuàng)新亮相

在上午的小米開發(fā)者大會中,如果問哪個部分最常被提及的話,那或許就是相機影像技術了。

2016年4月,小米在手機業(yè)務成立核心器件部,下設相機組;

2018年,“相機組”單獨成立一級部門“相機部”。

時至今日,小米相機部的團隊已經從122人擴增至850人,另外還有350名AI工程師,并在北京、東京、巴黎等9地設立研發(fā)中心,邀請超過40位全球行業(yè)泰斗加盟,以打造世界頂級影像表現。

從目前的成果來看,小米在相機影像技術方面可以說是成功的,諸如在太空拍地球等諸多創(chuàng)新嘗試令消費者驚嘆。

在之后小米集團副總裁、集團技術委員會主席崔寶秋演講中,“相機影像能力”也成為重點分享內容:120倍潛望式長焦、128°超廣角、長焦微距、一億像素……

而就在今天下午的演講部分,小米也不負眾望的帶來了最新的相機創(chuàng)新技術——伸縮式大光圈鏡頭?;谶@一技術,手機似乎在形態(tài)上正趨向于相機。

依據小米副總裁、手機部總裁曾學忠的介紹,該技術借鑒專業(yè)相機,自主開發(fā)伸縮相機技術,可在有限的尺寸下,達到更好的光學效果。

具體數據方面,超大光圈進光量提升300%,引入全新防抖技術,畫面更穩(wěn)定,清晰度提升20%。目前該技術已實現了小型化,可做到手機中。

在介紹的最后,曾學忠也表示,在不久的將來,這一技術將會與用戶見面。

小愛同學5.0、開放相機三大功能……小米發(fā)布6項技術

作為一個智能語音助手,在小米智能生態(tài)中,小愛同學作為“入口守護者”的重要性不言而喻。

小米集團副總裁、技術委員會主席崔寶秋在現場表示,小愛同學截至目前累計喚醒次數已達617億次,可能是中國最活躍的AI語音交互平臺;激活小愛同學的設備數達到2.28億臺;小愛同學月活躍用戶達到7840萬。

而在此次現場,崔寶秋也正式揭開了小愛同學5.0版本的神秘面紗,以及與此相關的產品升級。

· 小愛同學5.0

全場景智能協同:協同喚醒——多設備環(huán)境下智能選用最佳方式應答傾聽;協同響應——多設備環(huán)境下智能調度最優(yōu)設備響應執(zhí)行;協同提醒——多設備環(huán)境下自動生成個性化設備聯動建議;

對話式主動智能;

定制化情感聲音:兒童音色泡芙;定制聲音終端上線;更地道的粵語;

多模態(tài)融合交互:小愛同學音箱端支持手勢控制、童臉識別、距離檢測;小愛同學手機端支持多模態(tài)輸入掃描、識物、翻譯、掃文檔等;

智慧學習好助手:AI課程表——支持1000所高校、拍攝導入、全終端通用;AI翻譯——面對面翻譯、連續(xù)翻譯、一句話翻譯;K12教輔——精選優(yōu)質視頻網課,教育會員三端共享;知識問答——十萬個為什么,世界之最。

據悉,目前使用小米智能設備的用戶已超3600萬,設置智能互聯場景的用戶達900萬,每天使用智能掃地機器人的家庭超過400萬,小米的智能門鎖守護了超過200萬個家庭的安全。

“小米的技術已經滲透到了人們生活的方方面面,而小愛同學5.0正是大家的智能生活助手。”崔寶秋在現場表示。

· MiNLP 3.0 &下一代語音識別工具

去年的開發(fā)者大會上,小米發(fā)布了MiNLP 2.0版本,今年則帶來全新的3.0版本,具體的升級主要體現在:

升級至四大功能板塊——在基礎算法、語義理解上,新增內容理解、輿情分析模塊

提升語義解析技術——結合預訓練、知識圖譜能力,全面提升深層語義解析技術

拓展多模態(tài)理解能力——基于文本、語音、圖像和視頻等多模態(tài)特征,對內容精準理解

與此同時,崔寶秋也表示,開源一定是未來的方向。這之后,他對外公布了MiNLP開源計劃。

依據計劃,小米的第一步是在2020年11月中下旬正式對外開源MiNLP-分詞,2021年Q1開放MiNLP-詞性標注,2021年Q2開放MiNLP-命名實體識別,2021年Q3對外開放MiNLP-語義相關功能。

值得注意的是,MiNLP 3.0和開源計劃并不是小米在智能語音語義技術方面的全部實力。

崔寶秋在現場說到,“去年Daniel Povey加入了小米,擔任小米集團語音首席科學家,他在加入時就說要打造下一代Kaldi。”就在現場,Povey也被邀請上臺,介紹了下一代Kaldi的相關情況。

Povey介紹,在下一代Kaldi中,“K2”語音識別庫將是最核心的部分,它可以消除過往語音識別算法中的一些代碼不匹配問題,并且速度更快、通用性更強,可以用來建模多種語音識別算法。

· 移動端深度學習框架MACE 1.0&物聯網軟件平臺Xiaomi Vela

MACE全稱為Mobile AI Compute Engine,是一個移動端的深度學習框架,第一次出現在小米發(fā)布會是在2018年,直到2019年才推出0.12版本。彼時,MACE針對移動芯片特性進行了大量優(yōu)化,在小米手機上的人像模式、場景識別功能中已廣泛應用。

今天的開發(fā)者大會上,MACE升級到了1.0版本——MACE Micro,這是小米單獨為小規(guī)模IoT產品打造的引擎。依據崔寶秋的介紹,MACE Micro的代碼量低至數百KB,傳感器和處理器功耗均小于1毫瓦,成本低至0.1美元,將致力于助力AI全線賦能AIoT產品。

眾所周知,AIoT已經成為了小米生態(tài)戰(zhàn)略的一部分,而除了AI計算引擎,小米也帶來了物聯網軟件平臺“Xiaomi Vela”,該平臺基于開源的NuttX系統打造而成。

基于過往的成果,以及此次發(fā)布的計算引擎和專用平臺,就“賦能AIoT”這條道路上,可以看到在走得更遠的同時,小米也沒有忘記夯實“地基”。

· 開放相機三大能力

崔寶秋在現場表示,小米有信心讓自己的相機團隊繼續(xù)保持世界第一,這一自信的背后是小米對于技術的執(zhí)著投入。當前,小米已經在全球范圍內建立了超過200家實驗室,目前授權專利數量已經超過16000萬,境內專利占比55%。

令人興奮的是,就在今天的開發(fā)者大會上,小米方面宣布面向第三方APP開放相機三大能力,包括長焦、超廣角、微距、多攝同開的硬件能力,以及美顏、超級夜景、超級防抖等軟件能力。

同時,小米也將基于影像處理能力為IoT設備賦能,讓IoT設備在影像處理方面實現“質變”。

雷軍:小米模式是“互聯網+制造”,明年再招5000名工程師

就在今年8月份的十周年發(fā)布會上,雷軍就成表示,小米的模式的已經從互聯網發(fā)展為現在的“互聯網+制造”。

在今天的開發(fā)者大會上,雷軍再次強調小米的“互聯網+制造”模式,致力于幫助工廠實現智能化、自動化、無人化升級。與此同時,雷軍也提到了第二期智能工廠的規(guī)劃,“規(guī)模要大10倍,爭取做到一個人沒有。”

緊接著,雷軍也表示,小米的重點是突破硬核科技,而人才是創(chuàng)新之源。

依據計劃,小米原本今年要擴招3000人,不過由于疫情的影響拖慢了擴增的步伐,最終只招納了2800多人。

至于明年的擴招計劃,雷軍也在現場立下目標——擴招5000名工程師,并公布了人員招募的10個重點領域:

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論