Skip to main content

NVIDIA DGX-2 Hava Tahminini Hızlandırıyor

Günümüzde hava durumu ajansları ve rüzgar çiftlikleri, hava alanları, lojistik merkezleri, denizcilik operasyonları ve diğer birçok kuruluş, çoklu düğümlerde karmaşık bilgi işlem kümeleri üzerinde özelleştirilmiş hava durumu tahminleri yürütmektedir.

Bu yaklaşımdaki sorun, kümelenmelerin çoklu işletim sistemleri, paylaşılan dosya sistemleri ve karmaşık yönetim işlemleri gibi bir dizi zorlukla karşılaşmasıdır.

Meteoroloji ve İklimtoloji, İsviçre Meteoroloji ve İklimbilim Dairesi’nden araştırmacılar ve MeteoSwiss, hava tahminlerini daha erişilebilir hale getirmeye yardımcı olmak için, tek bir NVIDIA DGX-2 süper bilgisayarı üzerinde çalışabilecek ve bir kümeyle aynı performansı elde edebilecek bir hava durumu tahmin modeli geliştirdiler.

COSMO adlı algoritma, bir DGX-2 üzerinde 287 milyon şebeke hücresiyle MeteoSwiss’ten 1000 etki alanı veri kümesi çalıştırıyor.

Yukarıdaki görselleştirme, en son Turing GPU’larından yararlanmak için OptiX kullanan ışın izleme yetenekleriyle yakın zamanda geliştirilmiş olan ParaView adlı açık kaynaklı görselleştirme aracını kullanmaktır. Akış görselleştirme, yüksek basınç ve düşük basınç alanları arasındaki rüzgarı gösterir.

Supercomputing 18‘e katılanlar, NVIDIA standında simülasyonun canlı interaktif bir tanıtımını görebilirler.

Kaynak: Nvidia Developer News Center

SONY, NVIDIA V100 Tensor Core GPU’ları ile ResNet-50 Eğitim Rekorunu Kırdı

Kasım 13, 2018

SONY araştırmacıları ImageNet/ResNet-50 eğitimini 2100 tane NVIDIA Tesla V100 Tensor Core GPU’ları ile sadece 224 saniyede (3 dakika 44 saniye) %75 doğruluk tamamladıklarını duyurdu. Bu başarım, yayınlanmış en hızlı ResNet-50 eğitim süresi anlamına geliyor.

Takım, aynı zamanda 1088 adet NVIDIA Tesla V100 Tensor Core GPU’ları ile %90’ın üzerinde GPU ölçekleme verimi elde etmeyi başardı.

ImageNet/ResNet-50 eğitiminde GPU ölçekleme verimi

İşlemci Ara Bağlantı GPU ölçekleme verimi
Goyal ve diğ. [1] Tesla P100 x256 50Gbit Ethernet ∼90%
Akiba ve diğ. [5] Tesla P100 x1024 Infiniband FDR 80%
Jia ve diğ. [6] Tesla P40 x2048 100Gbit Ethernet 87.90%
Bu çalışma Tesla V100 x1088 Infiniband EDR x2 91.62%

ImageNet/ResNet-50 ile eğitim süresi ve en iyi doğrulama doğruluğu SONY takımı makalesinde “Derin öğrenmede artış için veri seti boyutu ve derin sinir ağı (DNN) modeliyle birlikte, modeli eğitmek için gereken zaman da artıyor.” yazdı.

Paket büyüklüğü İşlemci DL Kütüphanesi Süre Doğruluk
He ve diğ. 256 Tesla P100 x8 Caffe 29 saat 75.30%
Goyal ve diğ. 8K Tesla P100 x256 Caffe2 1 saat 76.30%
Smith ve diğ. 8K→16K full TPU Pod TensorFlow 30 dk 76.10%
Akiba ve diğ. 32K Tesla P100 x1024 Chainer 15 dk 74.90%
Jia ve diğ. 64K Tesla P40 x2048 TensorFlow 6.6 dk 75.80%
Bu çalışma 34K→68K Tesla V100 x2176 NNL 224 sn 75.03%

Takım bu rekoru kırmak için, araştırmacılar iki öncelikli konu olan: geniş mini-paket eğitimi kararsızlığı ve takım içi iletişim uyumluluğu ile büyük ölçekli dağıtımlı eğitimine önem verdiklerini ifade etti.

Araştırmacılar, “Biz geniş mini-paket kararsızlığını göstermek için bir paket boyu kontrol tekniğini benimsedik.” dedi. “Aynı zamanda, GPU’lar arasında verimli bir gradient değişimi için 2D-Torus şeması geliştirdik.”

2D-Torus, verimli bir haberleşme topolojisi gibi hizmet veriyor ve bu da iletişimde takıma uyum sağlama süresini azaltıyor.

Yazılım: Takım “Derin Sinir Ağı eğitim kütüphanesi (DNN) olarak Yapay Sinir Ağı Kütüphaneleri (NNL) ve bunların CUDA eklentilerini kullandık.” dedi. “NNL 1.0.0 CUDA 9.0 verisonları tabanlı geliştirme kolları ile GPU’larda DNN eğitimi için de cuDNN 7.3.1’i kullandık.”

Takım, makalelerinde “Haberleşme kütüphanesi olarak NCCL versiyon 2.3.5 ve OpenMPI versiyon 2.1.3’ü kullandık. 2D-Torus all-reduce ise NCCL2 ile uygulandı. Yukarıdaki yazılım da bir Singularity konteyner içinde paketlendi. Dağılmış DNN eğitimini koşturmak için Singularity versiyon 2.5.2’yi kullandık.” yazdı.

Bu çalışma geliştirme kütüphanesini güçlendirdi “Çekirdek Kütüphanesi: Sinir Ağı Kütüphaneleri Sony tarafından geliştirildi ve AI Bridging Cloud Infrastructure (ABCI) süper bilgisayarı, birinci sınıf hesaplama altyapısı Japan’s National Institute of Advanced Industrial Science and Technology (AIST) tarafından kuruldu ve işletildi. Bu sistem 4300 adet NVIDIA Volta Tensor Core GPU’ları tarafından çalıştırılıyor.

Kaynak: Nvidia Developer News Center

OpenZeka MARC 2019 Başvuruları Uzatıldı

OpenZeka MARC, yapay zeka algoritmalarının kullanıldığı Lise ve Üniversite öğrencileri ile Şirket/Girişimci çalışanlarının katılım sağlayabileceği mini otonom araç yarışmasıdır.

Son Başvuru Tarihi: 25 Ocak 2019

1. Eğitim Dönemi: 19-25 Ocak 2019 (7 gün süreli)
2. Eğitim Dönemi: 28 Ocak – 3 Şubat 2019 (7 gün süreli)

Yarışma kapsamında isteyen katılımcılara otonom araç inşa süreci, görüntü işleme, derin öğrenme, sensör füzyonu, 3D Stereo Kamera, Lidar, IMU verilerinin analizi ve otonom sürüş konularında uygulamalı eğitim verilecektir.

Eğitimlere katılım için giriş seviyesinde Python bilgisi yeterlidir. Open Zeka tarafından yazılım süreci geliştirilen 1/10 ölçekli araç platformu, otonom araç/makine uygulamaları geliştirmek isteyenlere en yeni yapay zeka algoritmalarını öğrenme imkanı sunmaktadır.

Başvuru ve detaylar için: https://openzeka.com/marc/

Görüntü İşleme İçin Derin Öğrenmenin Temelleri Eğitimi

Open Zeka, NVIDIA ve BTK Akademi işbirliği ile Üniversite Öğrencileri ve Akademik Personele Yönelik “Görüntü İşleme İçin Derin Öğrenmenin Temelleri Eğitimi26 Eylül 2018 günü BTK Merkez Bina yerleşkesinde gerçekleştirilecektir.

Kayıt: http://etkinlik.btk.gov.tr/etkinlik/detay/goruntu_isleme_icin_derin_ogrenmenin_temelleri_egitimi

NVIDIA DLI Sertifikalı

Katılım sayısı sınırlı olup, online ortamda yapılacak başvuru sırasına göre katılımcılar belirlenecektir. Başvurunuz onaylandığında size e-posta ile bildirim yapılacaktır.

Eğitim ücretsizdir ve sertifikalıdır. Gün sonunda online olarak yapılacak uygulama sınavını başarıyla tamamlayanlar NVIDIA DLI Sertifikası alacaklardır.

Eğitim uygulamalı olduğu için katılımcılar eğitime kendi dizüstü bilgisayarı ile katılmalıdır.

Üniversite öğrencilerinin Öğrenci Kimlik Kartlarını, akademisyenlerin ise Kurum Kimlik Kartlarını eğitim boyunca yanlarında bulundurması zorunludur

  • Son Kayıt Tarihi: 21/09/2018
  • Etkinlik Tarihi: 26/09/2018
  • Başlama Saati: 09:00
  • Bitiş Saati: 18:00
  • Adres: Eskişehir Yolu 10.Km No:276
    Çankaya
    06530
  • Şehir: Ankara

NVIDIA Jetson Ankara Meetup: AI at the Edge for Robotics & Smart Cities

Etkinliğe katılanlar Jetson TX2 Developer Kiti %50 indirimle alma fırsatından faydalanabilecektir. *

Kayıt: https://jetson.eventbrite.com

Tarih/Saat: 12 Temmuz 09.30-12.00

Adres: Bilkent Cyberpark Cyberplaza Konferans Salonu
Üniversiteler Mh., 1606 Cadde Cyber Plaza B Blok Çankaya/Ankara

Introduction

Enjoy a day of tech talks, demos, networking and drinks with NVIDIA AI experts and Jetson enthusiasts.

Learn about solutions using AI & ‘Inference at the Edge’ to solve commercial challenges in Autonomous Machines, Robotics, Video Analytics and Smart Cities.”

We’ll cover the latest insights on how customers use NVIDIA Jetson™ based solutions to push the limits of technology for intelligent and autonomous machines.

============================

Who should attend?

Developers interested in AI and Edge Solutions.

Business Startups and Commercial Managers working on solutions in Autonomous Devices, Robotics, Smart Cities.

Why attend?

Come along for an evening of talks and demos from NVIDIA Jetson™ experts and learn from innovative start-ups developing solutions based on the NVIDIA Jetson Inferencing platform.

Agenda

09.30 Registrations, treats, pastries and tea

10.10 Welcome – Open Zeka (Bilkent Cyberpark)

10.20 Welcome – NVIDIA – Eddie Seymour

11.00 Coffee – Tea Break

11.15 Jetson Demos by OpenZeka

11.30 Company Demos

11.59 Close

Jetson Demos

  • DeepStream
  • Jetson Inference
  • TensorRT
  • YOLO V3
  • OpenPose
  • Tensorflow Object Dectection API
  • Multimedia API
  • Visionworks 1.6
  • OpenZeka MARC

Don’t have a Jetson Developer Kit? Buy one on-site during the meetup at a %50 discounted special price of just 2.200 TL *

(*) %50 discount is valid for individual users and with limited stock.