WO2020133492A1

WO2020133492A1 - Procédé et appareil de compression de réseau neuronal

Info

Publication number: WO2020133492A1
Application number: PCT/CN2018/125812
Authority: WO
Inventors: 朱佳峰; 刘刚毅; 卢惠莉; 高伟; 芮祥麟; 杨鋆源; 夏军
Original assignee: 华为技术有限公司
Priority date: 2018-12-29
Filing date: 2018-12-29
Publication date: 2020-07-02
Also published as: CN113168554B; CN113168554A

Abstract

Un procédé et un appareil de compression de réseau neuronal, utilisés pour résoudre le problème de l'état de la technique selon lequel il n'est pas possible de s'adapter efficacement à la capacité d'un dispositif de traitement et d'obtenir un meilleur effet de traitement. Le procédé comprend les étapes consistant à : déterminer une longueur d'unité éparse selon des informations de capacité de traitement d'un dispositif de traitement ; lors de la réalisation d'un cycle d'entraînement actuel sur un modèle de réseau neuronal, selon un j-ième ensemble de poids référencé dans un cycle d'entraînement précédent, ajuster le j-ième ensemble de poids obtenu après le cycle d'entraînement précédent, et obtenir un j-ième ensemble de poids référencé dans le cycle d'entrainement actuel ; réaliser le cycle d'entraînement actuel sur le modèle de réseau neuronal selon divers ensembles de poids obtenus référencés dans le cycle d'entraînement actuel. La longueur d'unité éparse est la longueur de données d'une opération lorsque le dispositif de traitement effectue des opérations matricielles, le nombre de poids inclus dans le j-ième ensemble de poids est la longueur unitaire éparse, j est un nombre entier positif quelconque de 1 à m, et m est le nombre total d'ensembles de poids obtenus après regroupement de tous les poids du modèle de réseau neuronal selon la longueur d'unité éparse.