Meta Introduit DINOv3 : Modèle de Vision Auto-Supervisé Avancé Pour une Analyse Visuelle évolutive et de Haute Précision

En bref

DINOv3 est un modèle de vision par ordinateur auto-supervisé à la pointe de la technologie dont le seul backbone gelé fournit des caractéristiques d'image haute résolution et dépasse les solutions spécialisées dans plusieurs tâches de prédiction dense établies.

Meta Introduit DINOv3 : Modèle de vision auto-supervisé avancé surpassant les solutions spécialisées dans les tâches de prédiction dense

La division de recherche de la société technologique Meta, qui développe des technologies d'IA et de réalité augmentée, Meta AI a introduit DINOv3, un modèle de vision par ordinateur généraliste à la pointe de la technologie, entraîné par apprentissage auto-supervisé (SSL) pour générer des caractéristiques visuelles de haute qualité. Pour la première fois, une seule base de vision gelée surpasse des modèles spécialisés sur plusieurs tâches de prédiction denses établies, y compris la détection d'objets et la segmentation sémantique.

DINOv3 atteint cette performance grâce à des méthodes SSL avancées qui éliminent le besoin de données étiquetées, réduisant ainsi le temps d'entraînement et les exigences en ressources tout en permettant au modèle de s'adapter à 1,7 milliard d'images et 7 milliards de paramètres. Cette approche sans étiquette rend le modèle adapté aux applications où les annotations sont limitées, coûteuses ou indisponibles. Par exemple, les modèles de base DINOv3 pré-entraînés sur des images satellites ont montré de solides résultats sur des tâches en aval telles que l'estimation de la hauteur du couvert.

Le modèle devrait améliorer les applications actuelles et en permettre de nouvelles dans des secteurs tels que la santé, le suivi environnemental, les véhicules autonomes, le commerce de détail et la fabrication, offrant une meilleure précision et efficacité dans la compréhension visuelle à grande échelle.

DINOv3 est lancé avec un ensemble complet de backbones open source sous une licence commerciale, y compris un backbone axé sur les satellites formé sur des images MAXAR. Un sous-ensemble de têtes d'évaluation en aval est également partagé pour permettre aux chercheurs de reproduire et d'étendre les résultats. Des notebooks d'exemple et une documentation détaillée sont fournis pour aider la communauté à commencer à travailler avec DINOv3 immédiatement.

DINOv3 : Déverrouiller des applications à fort impact grâce à l'apprentissage auto-supervisé

Selon Meta AI, DINOv3 représente une avancée notable dans l'apprentissage auto-supervisé (SSL), montrant pour la première fois que les modèles SSL peuvent dépasser les performances des modèles faiblement supervisés sur un large éventail de tâches. Alors que les versions précédentes de DINO ont établi de solides résultats dans des tâches de prédiction dense comme la segmentation et l'estimation de profondeur monoculaire, DINOv3 s'appuie sur cette base et atteint des niveaux de performance encore plus élevés.

DINOv3 : Débloquer des applications à fort impact grâce à l'apprentissage auto-supervisé

DINOv3 fait progresser l'algorithme DINO original en éliminant le besoin d'entrées de métadonnées, en utilisant moins de puissance de calcul pour l'entraînement que les approches précédentes, tout en produisant des modèles de fondation vision performants. Les améliorations apportées par DINOv3 permettent d'obtenir des résultats à la pointe de la technologie sur des tâches en aval telles que la détection d'objets, même lorsque les poids du modèle restent figés, supprimant ainsi la nécessité d'un ajustement spécifique à la tâche et permettant une application plus polyvalente et efficace.

Parce que la méthodologie DINO n'est pas liée à un type d'image particulier, elle peut être appliquée dans divers domaines où l'étiquetage est coûteux ou impraticable. Les itérations précédentes, comme DINOv2, ont tiré parti de grandes quantités de données non étiquetées pour des applications médicales, y compris l'histologie, l'endoscopie et l'imagerie. Pour les images satellites et aériennes, où le volume et la complexité des données rendent l'étiquetage manuel infaisable, DINOv3 permet d'entraîner un seul modèle de backbone applicable à plusieurs sources satellites, soutenant des cas d'utilisation plus larges dans la surveillance environnementale, la planification urbaine et la réponse aux catastrophes.

DINOv3 démontre déjà un impact pratique. Le World Resources Institute (WRI) utilise le modèle pour surveiller la déforestation et guider les efforts de restauration, permettant aux groupes locaux de mieux protéger les écosystèmes. En analysant des images satellites pour détecter la perte d'arbres et les changements d'utilisation des terres, DINOv3 améliore la précision de la vérification du financement climatique, réduisant les coûts de transaction et accélérant le financement de petits projets locaux. Dans un cas, l'utilisation de DINOv3 formé sur des images satellites et aériennes a réduit l'erreur moyenne dans la mesure de la hauteur de la canopée d'arbres dans une région du Kenya de 4,1 mètres à 1,2 mètres, permettant au WRI d'élargir son soutien à des milliers d'agriculteurs et d'initiatives de conservation de manière plus efficace.

VSN-3.15%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)