Décentralisation des défis et des opportunités de l'entraînement AI : Prime Intellect ouvre un nouveau paradigme

Décentralisation entraînement: Exploration du Saint Graal dans le domaine de l'IA

Dans la chaîne de valeur complète de l'IA, l'entraînement des modèles est l'étape qui consomme le plus de ressources et présente le plus haut niveau de difficulté technique, déterminant directement la capacité maximale des modèles et l'efficacité de leur application réelle. Par rapport à l'appel léger de la phase d'inférence, le processus d'entraînement nécessite un investissement continu en puissance de calcul à grande échelle, des processus de traitement des données complexes et un soutien d'algorithmes d'optimisation intensifs, constituant ainsi le véritable "secteur lourd" de la construction des systèmes d'IA. D'un point de vue des paradigmes d'architecture, les méthodes d'entraînement peuvent être classées en quatre catégories : entraînement centralisé, entraînement distribué, apprentissage fédéré et entraînement décentralisé, qui est le sujet principal de cet article.

Le Saint Graal de la Crypto AI : exploration de pointe de l'entraînement décentralisé

L'entraînement centralisé est la méthode traditionnelle la plus courante, où un seul organisme réalise l'ensemble du processus d'entraînement au sein d'un cluster haute performance local, avec tous les composants allant du matériel, du logiciel de base, du système de gestion de cluster, jusqu'au cadre d'entraînement, coordonnés par un système de contrôle unifié. Cette architecture de profonde collaboration permet d'optimiser l'efficacité du partage de mémoire, de la synchronisation des gradients et des mécanismes de tolérance aux pannes, ce qui la rend particulièrement adaptée à l'entraînement de modèles à grande échelle tels que GPT et Gemini, présentant des avantages en termes d'efficacité et de contrôle des ressources, mais souffrant également de problèmes tels que le monopole des données, les barrières à l'entrée, la consommation d'énergie et le risque de point de défaillance.

L'entraînement distribué est la méthode principale pour l'entraînement de grands modèles actuellement. Son cœur consiste à décomposer les tâches d'entraînement du modèle et à les distribuer sur plusieurs machines pour une exécution collaborative, afin de surmonter les limites de calcul et de stockage d'une seule machine. Bien qu'il présente physiquement des caractéristiques "décentralisées", l'ensemble reste contrôlé, planifié et synchronisé par des organismes centralisés, fonctionnant souvent dans un environnement de réseau local à haute vitesse, utilisant la technologie de bus interconnexion haute vitesse NVLink, avec un nœud principal coordonnant unifié toutes les sous-tâches. Les méthodes principales comprennent :

  • Parallélisme des données : chaque nœud entraîne différents paramètres de données partagés, nécessite une correspondance des poids du modèle.
  • Parallélisme de modèle : déployer différentes parties du modèle sur différents nœuds pour réaliser une forte extensibilité
  • Pipeline parallèle : exécution en série par étapes, amélioration du débit
  • Parallélisme de tenseurs : segmentation fine du calcul matriciel, amélioration de la granularité du parallélisme

L'entraînement distribué est une combinaison de "contrôle centralisé + exécution distribuée", similaire à un même patron dirigeant à distance plusieurs employés de "bureau" pour accomplir des tâches en collaboration. Actuellement, presque tous les grands modèles principaux (GPT-4, Gemini, LLaMA, etc. ) sont entraînés de cette manière.

Le Saint Graal de Crypto AI : Exploration de pointe de l'entraînement décentralisé

La formation décentralisée représente une voie d'avenir plus ouverte et résistante à la censure. Ses caractéristiques principales sont les suivantes : plusieurs nœuds mutuellement méfiants ( peuvent être des ordinateurs personnels, des GPU cloud ou des dispositifs en périphérie ) collaborant pour accomplir des tâches de formation sans coordinateur central, généralement à travers des protocoles pour le partage et la collaboration des tâches, et en s'appuyant sur des mécanismes d'incitation cryptographique pour garantir l'honnêteté des contributions. Les principaux défis auxquels ce modèle est confronté incluent :

  • Difficulté d'hétérogénéité des appareils et de division : coordination difficile des appareils hétérogènes, efficacité de division des tâches faible
  • Goulot d'étranglement de l'efficacité de communication : la communication réseau est instable, le goulot d'étranglement de la synchronisation des gradients est évident.
  • Exécution fiable manquante : absence d'un environnement d'exécution fiable, difficile de vérifier si les nœuds participent réellement au calcul.
  • Manque de coordination unifiée : pas de planificateur central, distribution des tâches et mécanismes de retour en arrière complexes

La formation décentralisée peut être comprise comme : un groupe de bénévoles du monde entier qui contribuent chacun à la puissance de calcul pour entraîner le modèle de manière collaborative, mais la "vraie formation décentralisée à grande échelle réalisable" reste un défi d'ingénierie systémique, impliquant plusieurs niveaux tels que l'architecture système, les protocoles de communication, la sécurité cryptographique, les mécanismes économiques, et la validation des modèles. Cependant, la question de savoir si cela peut être "collaboratif et efficace + inciter à l'honnêteté + produire des résultats corrects" est encore à un stade précoce d'exploration de prototypes.

L'apprentissage fédéré, en tant que forme de transition entre la distribution et la Décentralisation, met l'accent sur la conservation locale des données et l'agrégation centralisée des paramètres du modèle, ce qui le rend adapté aux scénarios axés sur la conformité à la vie privée, comme la santé et la finance. L'apprentissage fédéré possède la structure d'ingénierie de l'entraînement distribué et la capacité de collaboration locale, tout en bénéficiant des avantages de la dispersion des données de l'entraînement décentralisé. Cependant, il dépend encore d'une partie coordonnatrice de confiance et ne possède pas les caractéristiques d'ouverture totale et de résistance à la censure. On peut le considérer comme une solution de "Décentralisation contrôlée" dans des scénarios de conformité à la vie privée, qui est relativement modérée en termes de tâches d'entraînement, de structure de confiance et de mécanismes de communication, ce qui la rend plus appropriée comme architecture de déploiement transitoire dans l'industrie.

Le Saint Graal de Crypto AI : exploration à la pointe de l'entraînement décentralisé

Décentralisation des limites, des opportunités et des chemins réalistes de l'entraînement

D'un point de vue des paradigmes d'entraînement, la Décentralisation de l'entraînement n'est pas adaptée à tous les types de tâches. Dans certains scénarios, en raison de la complexité de la structure des tâches, des exigences en ressources extrêmement élevées ou des difficultés de collaboration, elle n'est naturellement pas adaptée à être réalisée efficacement entre des nœuds hétérogènes et non fiables. Par exemple, l'entraînement de grands modèles dépend souvent de la haute mémoire graphique, de la faible latence et de la bande passante élevée, rendant difficile une découpe et une synchronisation efficaces sur un réseau ouvert; les tâches dont la confidentialité des données et les restrictions de souveraineté sont fortes, comme la santé, la finance, et les données sensibles (, sont limitées par la conformité légale et les contraintes éthiques, et ne peuvent pas être partagées ouvertement; tandis que les tâches manquant de bases d'incitation à la collaboration, comme l'entraînement de modèles propriétaires d'entreprise ou de prototypes internes ), manquent de motivation pour la participation externe. Ces limites forment ensemble les restrictions réelles de l'entraînement décentralisé actuel.

Mais cela ne signifie pas que l'entraînement décentralisé est un faux problème. En fait, dans les types de tâches légères, facilement parallélisables et incitatives, l'entraînement décentralisé montre des perspectives d'application claires. Cela inclut, sans s'y limiter : le fine-tuning LoRA, les tâches d'entraînement post-alignment comportemental ( telles que RLHF, DPO), l'entraînement et l'annotation par crowdsourcing de données, l'entraînement de petits modèles de base avec contrôle des ressources, ainsi que des scénarios d'entraînement collaboratif impliquant des dispositifs en périphérie. Ces tâches présentent généralement des caractéristiques de haute parallélisation, de faible couplage et de tolérance à la puissance de calcul hétérogène, ce qui les rend très adaptées à l'entraînement collaboratif via des réseaux P2P, des protocoles Swarm, des optimiseurs distribués, etc.

Le Saint Graal de Crypto AI : exploration à la pointe de l'entraînement décentralisé

Décentralisation entraînement classique projet analyse

Actuellement, dans le domaine de la formation décentralisée et de l'apprentissage fédéré, les projets blockchain les plus représentatifs incluent Prime Intellect, Pluralis.ai, Gensyn, Nous Research et Flock.io. En termes d'innovation technique et de difficulté de mise en œuvre, Prime Intellect, Nous Research et Pluralis.ai ont proposé de nombreuses explorations originales dans l'architecture système et la conception d'algorithmes, représentant les directions de pointe de la recherche théorique actuelle ; tandis que les chemins de mise en œuvre de Gensyn et Flock.io sont relativement clairs, montrant des progrès d'ingénierie préliminaires. Cet article analysera successivement les technologies clés et l'architecture d'ingénierie derrière ces cinq projets, et explorera en outre leurs différences et relations complémentaires dans le système de formation AI décentralisé.

( Prime Intellect : un pionnier des réseaux de collaboration d'apprentissage renforcé vérifiables par des trajectoires d'entraînement

Prime Intellect s'engage à construire un réseau d'entraînement d'IA sans confiance, permettant à quiconque de participer à l'entraînement et de recevoir des récompenses fiables pour sa contribution de calcul. Prime Intellect espère, à travers les trois modules PRIME-RL + TOPLOC + SHARDCAST, construire un système d'entraînement d'IA décentralisé avec vérifiabilité, ouverture et un mécanisme d'incitation complet.

)# 01、Structure de la pile de protocoles Prime Intellect et valeur des modules clés

Le Saint Graal de Crypto AI : Exploration à la pointe de l'entraînement décentralisé

02, Explication détaillée des mécanismes clés de formation de Prime Intellect

#PRIME-RL: Architecture de tâche de renforcement asynchrone découplée

PRIME-RL est un cadre de modélisation et d'exécution des tâches personnalisé par Prime Intellect pour des scénarios d'entraînement décentralisés, conçu spécialement pour des réseaux hétérogènes et des participants asynchrones. Il utilise l'apprentissage par renforcement comme objet d'adaptation prioritaire, découplant de manière structurelle les processus d'entraînement, d'inférence et de téléchargement de poids, permettant ainsi à chaque nœud d'entraînement de compléter indépendamment la boucle de tâche localement et de collaborer via des interfaces standardisées avec des mécanismes de validation et d'agrégation. Par rapport aux processus d'apprentissage supervisé traditionnels, PRIME-RL est plus adapté à la mise en œuvre d'un entraînement élastique dans un environnement sans planification centrale, réduisant ainsi la complexité du système tout en posant les bases pour prendre en charge l'exécution parallèle de multiples tâches et l'évolution des stratégies.

#TOPLOC:Mécanisme de vérification des comportements d'entraînement léger

TOPLOC###Observation de Confiance et Vérification de la Localité( est un mécanisme central de vérification de l'entraînement proposé par Prime Intellect, utilisé pour déterminer si un nœud a réellement complété un apprentissage de stratégie valide basé sur des données d'observation. Contrairement à des solutions lourdes comme ZKML, TOPLOC ne dépend pas du recalcul complet du modèle, mais analyse plutôt la trajectoire de cohérence locale entre "séquence d'observation ↔ mise à jour de la stratégie" pour réaliser une vérification de structure allégée. Il transforme pour la première fois les trajectoires de comportement pendant le processus d'entraînement en objets vérifiables, ce qui représente une innovation clé pour réaliser une distribution de récompenses d'entraînement sans confiance, offrant une voie praticable pour construire un réseau d'entraînement décentralisé, auditables et incitatifs.

#SHARDCAST: Protocole d'agrégation et de propagation des poids asynchrones

SHARDCAST est un protocole de propagation et d'agrégation de poids conçu par Prime Intellect, optimisé pour des environnements de réseau réels asynchrones, à bande passante limitée et avec des états de nœuds changeants. Il combine un mécanisme de propagation gossip et une stratégie de synchronisation locale, permettant à plusieurs nœuds de soumettre en continu des mises à jour partielles dans un état de désynchronisation, réalisant la convergence progressive des poids et l'évolution de multiples versions. Par rapport aux méthodes AllReduce centralisées ou synchronisées, SHARDCAST améliore considérablement l'évolutivité et la tolérance aux pannes de l'entraînement décentralisé, constituant la base essentielle pour établir un consensus de poids stable et pour les itérations d'entraînement continu.

#OpenDiLoCo: Cadre de communication asynchrone sparse

OpenDiLoCo est un cadre d'optimisation de communication indépendant et open source réalisé par l'équipe Prime Intellect basé sur le concept DiLoCo proposé par DeepMind, spécialement conçu pour relever les défis courants des formations décentralisées tels que la bande passante limitée, l'hétérogénéité des appareils et l'instabilité des nœuds. Son architecture est basée sur la parallélisation des données, en construisant des structures topologiques clairsemées telles que Ring, Expander et Small-World, évitant ainsi le coût de communication élevé de la synchronisation globale, et permettant d'achever l'entraînement collaboratif du modèle en se basant uniquement sur les nœuds voisins locaux. En combinant des mises à jour asynchrones et un mécanisme de tolérance aux pannes, OpenDiLoCo permet aux GPU grand public et aux appareils de périphérie de participer de manière stable aux tâches d'entraînement, améliorant considérablement la possibilité de participation à l'entraînement collaboratif mondial, et constitue l'une des infrastructures de communication clés pour construire un réseau d'entraînement décentralisé.

#PCCL: bibliothèque de communication collaborative

PCCL)Prime Collective Communication Library### est une bibliothèque de communication légère conçue sur mesure par Prime Intellect pour un environnement d'entraînement AI décentralisé, visant à résoudre les goulots d'étranglement d'adaptation des bibliothèques de communication traditionnelles ( telles que NCCL et Gloo) dans des dispositifs hétérogènes et des réseaux à faible bande passante. PCCL prend en charge les topologies éparses, la compression des gradients, la synchronisation à faible précision et la récupération par point de contrôle, pouvant fonctionner sur des GPU grand public et des nœuds instables, constituant le composant sous-jacent qui soutient la capacité de communication asynchrone du protocole OpenDiLoCo. Il améliore considérablement la tolérance à la bande passante et la compatibilité des dispositifs pour construire un véritable réseau d'entraînement collaboratif ouvert et sans confiance, en débloquant la "dernière étape" de la communication.

(# 03, Réseau d'incitation Prime Intellect et division des rôles

Prime Intellect a construit un réseau d'entraînement sans permission, vérifiable et doté d'un mécanisme d'incitation économique, permettant à quiconque de participer aux tâches et de recevoir des récompenses en fonction de contributions réelles. Le protocole fonctionne sur la base de trois types de rôles clés :

  • Initiateur de la tâche : définir l'environnement d'entraînement, le modèle initial, la fonction de récompense et les critères de validation
  • Nœud d'entraînement : exécuter un entraînement local, soumettre des mises à jour de poids et des trajectoires d'observation
  • Nœud de validation : utiliser le mécanisme TOPLOC pour vérifier la véracité des comportements d'entraînement et participer au calcul des récompenses et à l'agrégation des stratégies.

Le processus central de l'accord comprend la publication de tâches, la formation des nœuds, la validation des trajectoires, l'agrégation des poids ) SHARDCAST ( et la distribution des récompenses, formant ainsi un cercle d'incitation autour du "comportement d'entraînement réel".

![Le Saint Graal de Crypto AI : exploration à la pointe de la formation décentralisée])https://img-cdn.gateio.im/webp-social/moments-0a322ea8b70c3d00d8d99606559c1864.webp###

(# 04, INTELLECT-2 : Lancement du premier modèle d'entraînement décentralisé vérifiable

Prime Intellect a lancé INTELLECT-2 en mai 2025, qui est le premier au monde à être décentralisé.

PRIME0.14%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 9
  • Reposter
  • Partager
Commentaire
0/400
GasFeeCryervip
· 07-29 21:37
C'est quoi cette industrie lourde ? Mining n'est pas plus fatigant ?
Voir l'originalRépondre0
OnChain_Detectivevip
· 07-29 21:35
hmm... formation d'IA centralisée ? grand drapeau rouge détecté. l'analyse des modèles montre des risques de point de défaillance unique, pour être honnête.
Voir l'originalRépondre0
AirdropHarvestervip
· 07-29 02:38
prendre les gens pour des idiots, c'est tout. Qui sait, qui s'enrichit.
Voir l'originalRépondre0
RooftopReservervip
· 07-26 22:20
Quelle grande pièce maîtresse, c'est impressionnant !
Voir l'originalRépondre0
Whale_Whisperervip
· 07-26 22:13
bull ah cette vague de composants d'entraînement ne doit pas être utilisée sur Q
Voir l'originalRépondre0
CodeSmellHuntervip
· 07-26 22:12
Ah, à quoi ça sert d'autre que de faire chauffer les cartes graphiques ?
Voir l'originalRépondre0
ThatsNotARugPullvip
· 07-26 22:12
J'ai jeté un coup d'œil, j'ai l'impression que ce sont tous des pièges.
Voir l'originalRépondre0
DaisyUnicornvip
· 07-26 22:04
Waouh~ La formation en Décentralisation est comme une petite fleur sauvage en désordre.
Voir l'originalRépondre0
ApeWithNoFearvip
· 07-26 21:47
Le Mining consomme déjà beaucoup, et maintenant il faut encore brûler de l'électricité pour l'IA ?
Voir l'originalRépondre0
Afficher plus
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)