Nella giornata di ieri è emersa la notizia secondo la quale Huawei ha rilasciato l’HiAI Engine insieme al suo nuovo top di gamma P20.

Sotto la scocca dei nuovi Huawei P20 e P20 Pro è presente il SoC HiSilicon Kirin 970, che il produttore cinese aveva lanciato nel mese di ottobre dello scorso anno a insieme alla gamma Mate 10. Il Kirin 970 di Huawei si contraddistingue per la presenza di hardware dedicato all’intelligenza artificiale, vale a dire l’ormai nota NPU (Neural Processing Unit).

Circa un mese fa, inoltre, avevamo visto come Huawei fosse impegnata nello sviluppo di HiAssistant (powered by HiAI), un competitor dell’accoppiata Google Assistant + Google Lens dedicato esclusivamente al mercato cinese.

HiAI è la piattaforma proprietaria di Huawei dedicata all’intelligenza artificiale. Al momento attuale, la NPU a bordo degli smartphone con SoC Kirin 970 viene sfruttata per feature interessanti, quali ad esempio il riconoscimento in tempo reale di oggetti e scene tramite l’app della fotocamera, o ancora per la traduzione rapida offline con Microsoft Translator. Ad ogni modo, queste capacità costituiscono espressione soltanto di una piccola parte delle reali potenzialità del machine learning e delle reti neurali. Insomma, è giusto dire che ci troviamo ancora agli albori dell’AI a bordo degli smartphone, ma le attuali capacità sono già piuttosto promettenti per il futuro di questa tecnologia.

Secondo quanto afferma Huawei, l’HiAI Engine apre ad “application capabilities“, attraverso l’integrazione di “a plurality of AI capabilities and apps [that make] the apps more intelligent and powerful.” Gli sviluppatori adesso hanno la possibilità di scaricare DDK (Driver Development Kit), SDK ed IDE per l’HiAI Engine.

Per quanto riguarda le menzionate “application capabilities” dell’HiAI Engine, è incluso un Computer Vision (CV) engine. Con questa denominazione si fa riferimento alle “capacità grazie alle quali i computer simulano il sistema visivo umano allo scopo di percepire l’ambiente circostante e determinare, riconoscere e capire la composizione dello spazio”, stando a quanto dichiara Huawei. Tra le capacità del citato Computer Vision engine sono incluse Image Super Resolution, Facial Recognition ed Object Recognition (a proposito dei quali, di seguito, si entrerà più nel dettaglio). L’HiAI Engine comprende anche un ASR (Automatic Speech Recognition) engine, che tuttavia è limitato soltanto alla Cina. Un ASR engine è ciò che si occupa di convertire la voce umana in testo e tra le sue capacità rientrano speech recognition, speech conversion e text-to-speech (TTS), ovvero la conversione opposta.

Tra le capacità dell’HiAI Engine di Huawei è opportuno fare menzione anche del NLU (Natural language understanding) engine, tuttavia anche quest’ultimo, al pari dell’ASR engine, è dedicato esclusivamente alla Cina. Il NLU engine permette ai computer di capire la voce umana, consentendo loro di eseguire comunicazioni o azioni naturali. Tra le sue capacità possiamo citare la segmentazione delle parole, il riconoscimento dell’entità del testo, l’analisi dell’inflessione emotiva e la traduzione automatica.

Le feature dell’HiAI Engine di Huawei sono:

  • Scene Detection: Riconduce le immagini a specifiche categorie attraverso il riconoscimento della scena in esse contenuta. Secondo Huawei questa funzione, attualmente supportata, garantisce un’elevata precisione.
  • Document Correction and Document Detection: Questa funzione permette di correggere gli angoli di un documento e può anche riconoscere automaticamente le informazioni sulla posizione del documento nell’immagine.
  • Face Detection and Facial Comparison: Huawei evidenzia il riconoscimento di informazioni sulla posizione, segni particolari ed espressioni del volto nelle immagini e “high-precision facial rectangular coordinates”.
  • Image Category Label: Sfrutta il deep learning per riconoscere oggetti, scene e comportamenti nelle immagini.
  • Image Super Resolution: Ingrandisce le immagini grazie al deep learning; inoltre, elimina eventuali artefatti lasciando invariata la risoluzione per migliorare la qualità dell’immagine.
  • Character Image Super Resolution: In sostanza la feature precedente per migliorare i soggetti presenti nelle immagini.
  • Code Detection: Riconosce QR code e codici a barre per ottenere le informazioni incluse. Questa capacità viene integrata nelle applicazioni.

Ecco i link per il download di DDK, SDK, IDE dell’HiAI Engine di Huawei.

Vai a: Huawei HiAssistant potrebbe presto sfidare Google, Amazon e Samsung