Basic of AI Accelerator Design using Verilog HDL - Slideshare
文章推薦指數: 80 %
Basic of AI Accelerator Design using Verilog HDL. 1. Basic of AI Accelerator Design using Verilog HDL Joohan KIM Ver. 20200512 https://blog.naver.com/ ...
SlideShareverwendetCookies,umdieFunktionalitätundLeistungsfähigkeitderWebseitezuverbessernundIhnenrelevanteWerbungbereitzustellen.WennSiedieseWebseiteweiterbesuchen,erklärenSiesichmitderVerwendungvonCookiesaufdieserSeiteeinverstanden.LesenSiebitteunsereNutzervereinbarungunddieDatenschutzrichtlinie.
SlideShareverwendetCookies,umdieFunktionalitätundLeistungsfähigkeitderWebseitezuverbessernundIhnenrelevanteWerbungbereitzustellen.WennSiedieseWebseiteweiterbesuchen,erklärenSiesichmitderVerwendungvonCookiesaufdieserSeiteeinverstanden.LesenSiebitteunsereunsereDatenschutzrichtlinieunddieNutzervereinbarung.
Start
Entdecken
Einloggen
Registrieren
DiesePräsentationwurdeerfolgreichgemeldet.
Aktivieredeinekostenlose30-tägigeTestversion,umunbegrenztzulesen.
BasicofAIAcceleratorDesignusingVerilogHDL
0
Teilen
JoohanKIM
•
27.Mär2020
•
0gefälltmir
•
83Aufrufe
Jetztherunterladen
Herunterladen
NächstePräsentationen
DuliesteineVorschau.
Erstelledeinekostenlose30-tägigeTestversion,umweiterzulesen.
Kostenlosfortfahren
NächsteSlideShare
Yannlecun
Wirdgeladenin …3
×
Facebook
Twitter
LinkedIn
Größe(px)
StartenSiemit
ÄhnlicheSlideSharesamEndeanzeigen
Teilen
E-Mail
AmmeistengeclippteFolie
1
1von155
BasicofAIAcceleratorDesignusingVerilogHDL
27.Mär2020
•
0gefälltmir
•
83Aufrufe
0
Teilen
Jetztherunterladen
Herunterladen
Herunterladen,umofflinezulesen
Ingenieurwesen
ppt:BasicofAIAcceleratorDesignusingVerilogHDL
git:https://github.com/matbi86/01_ai_accelerator_basic_for_student
ref:http://eyeriss.mit.edu/tutorial.html
Mehrerfahren
JoohanKIM
Folgen
ppt:BasicofAIAcceleratorDesignusingVerilogHDL
git:https://github.com/matbi86/01_ai_accelerator_basic_for_student
ref:http://eyeriss.mit.edu/tutorial.html
Mehrerfahren
Ingenieurwesen
Yannlecun
Yandex
MLconf-DistributedDeepLearningforClassificationandRegressionProblems...
SriAmbati
H2ODeepLearningThroughExamples021215
SriAmbati
NeuralNetworks.Overview
OleksandrBaiev
DeepLearningintheWildwithArnoCandel
SriAmbati
DeepLearninglibrariesandfirstexperimentswithTheano
VincenzoLomonaco
DIYDeepLearningwithCaffeWorkshop
odsc
DeepLearningwithPython(PyDataSeattle2015)
AlexanderKorbonits
ParallelProgramminginPython:Speedingupyouranalysis
ManojitNandi
DeepConvolutionalNetworkevaluationontheIntelXeonPhi
GauravRaina
Yannlecun
Yandex
MLconf-DistributedDeepLearningforClassificationandRegressionProblems...
SriAmbati
H2ODeepLearningThroughExamples021215
SriAmbati
NeuralNetworks.Overview
OleksandrBaiev
DeepLearningintheWildwithArnoCandel
SriAmbati
DeepLearninglibrariesandfirstexperimentswithTheano
VincenzoLomonaco
DIYDeepLearningwithCaffeWorkshop
odsc
DeepLearningwithPython(PyDataSeattle2015)
AlexanderKorbonits
ParallelProgramminginPython:Speedingupyouranalysis
ManojitNandi
DeepConvolutionalNetworkevaluationontheIntelXeonPhi
GauravRaina
WeitereVerwandteInhalte
DasKönnteIhnenAuchGefallen
DeepConvolutionalNeuralNetworkaccelerationontheIntelXeonPhi
GauravRaina
딥러닝개요(2015-05-09KISTEP)
KeunwooChoi
IntrotoNeuralNetworks
DeanWyatte
IntroductiontoConvolutionalNeuralNetworks
HannesHapke
ConvNetJS&CaffeJS
Anyline
GömülüSistemlerdeDerinÖğrenmeUygulamaları
FerhatKurt
FromConventionalMachineLearningtoDeepLearningandBeyond.pptx
Chun-HaoChang
Notesfrom2016bayareadeeplearningschool
NiketanPansare
IntroductiontoDeepLearning
OlegMygryn
Convolutionalneuralnetworkinpractice
남주김
IkaLog:DataCollectorforSplatoonandMachineLearning
TakeshiHASEGAWA
AmazonDeepLearning
AmandaMackay(she/her)
Deeplearningの概要とドメインモデルの変遷
TaigaNomi
2値化CNNonFPGAでGPUとガチンコバトル(公開版)
HirokiNakahara
DeepLearninginiOSTutorial
Anyline
SqueezingDeepLearningIntoMobilePhones
AnirudhKoul
ADeeperDiveintoApacheMXNet-March2017AWSOnlineTechTalks
AmazonWebServices
ADeeperDiveintoApacheMXNet-March2017AWSOnlineTechTalks
AmazonWebServices
BestDeepLearningPostfromLinkedInGroup
FarshidPirahansiah
TensorProcessingUnit(TPU)
AntoniosKatsarakis
Thedeeplearningtour-Q12017
EranShlomo
ScalableDeepLearningonAWSwithApacheMXNet
JulienSIMON
WhyisDeeplearninghotrightnow?andHowcanweapplyitoneachdayjob?
IssamAlZinati
Convolutionalneuralnetwork
YanXu
IntroductiontoRecurrentNeuralNetwork
YanXu
2値ディープニューラルネットワークと組込み機器への応用:開発中のツール紹介
HirokiNakahara
DeepLearning&Tensorflow:AnIntro
SibyJosePlathottam
[AI07]RevolutionizingImageProcessingwithCognitiveToolkit
de:code2017
NVIDIA深度學習教育機構(DLI):Approachestoobjectdetection
NVIDIATaiwan
NVIDIA深度學習教育機構(DLI):Neuralnetworkdeployment
NVIDIATaiwan
MachineLearninginAction
AmazonWebServices
Introductiontodeeplearning
AbhishekBhandwaldar
CNNDataflowImplementationonFPGAs
NECSTLab@PolitecnicodiMilano
DeepLearningInitiative@NECSTLab
NECSTLab@PolitecnicodiMilano
IntrotoScalableDeepLearningonAWSwithApacheMXNet
AmazonWebServices
DeepDiveintoApacheMXNetonAWS
KristanaKane
DistributedDeepLearningonAWSwithApacheMXNet
AmazonWebServices
DLDmeetup2017,EfficientDeepLearning
Brodmann17
IntroductiontoGenerativeAdversarialNetworks(GAN)withApacheMXNet
AmazonWebServices
FPGAsinthecloud?(October2017)
JulienSIMON
ÄhnlicheBücher
Kostenlosmiteiner30-tägigenTestversionvonScribd
Alleanzeigen
LexikonderSymboleundArchetypenfürdieTraumdeutung
PeterChairon
(0/5)
Kostenlos
AkkusundBatterienrichtigpflegenundladen:Leichtgemacht,GeldundÄrgergespart!
BoHanus
(0/5)
Kostenlos
OpelAstraH3/04-11/09,OpelZafiraB7/05-11/10:Sowird´sgemacht-Band135
RüdigerEtzold
(4.5/5)
Kostenlos
Antarktis-dieverboteneWahrheit:SchaltstelleGeheimerWeltraumprogramme,ZentralefürinterplanetarenSklavenhandel,LandeplatzaußerirdischerFlüchtlinge
MichaelE.Salla
(3/5)
Kostenlos
CommandLineKungFu:Bash-Scripting-Tricks,LinuxTippsundpraktischeEinzeilerfürdieShell
JasonCannon
(0/5)
Kostenlos
OpelCorsaC9/00bis9/06,OpelMeriva5/03bis4/10:Sowird´sgemacht,Band131
RüdigerEtzold
(0/5)
Kostenlos
Elektro-InstallationenimHaus:LeichtverständlicheAnleitungenfürvölligunerfahreneEinsteigerundProfi-Heimwerker
BoHanus
(0/5)
Kostenlos
Panzerketten:DieGleiskettenderdeutschenKettenfahrzeugedesZweitenWeltkrieges
PeterSchwarzmann
(4.5/5)
Kostenlos
VWPoloIV11/01-5/09,SeatIbiza4/02-4/08:Sowird´sgemacht-Band129
RüdigerEtzold
(3.5/5)
Kostenlos
DieBlockchain-Revolution:WiedieTechnologiehinterBitcoinnichtnurdasFinanzsystem,sonderndieganzeWeltverändert
DonTapscott
(3.5/5)
Kostenlos
DerleichteEinstiegindieElektrotechnik&Elektronik:BauteilederElektrotechnik·Solartechnik·Netzgeräte·MotorenundGeneratoren·Messgeräte·Beleuchtung
BoHanus
(5/5)
Kostenlos
DerHaunebuAntrieb:Sofunktionier(t)endielegendärenUFOs
HolgerErutan
(0/5)
Kostenlos
DasneueWerkbuchElektronik:DaskompletteKnow-howderElektronikaktuellerklärt
RüdigerKlein
(5/5)
Kostenlos
OpelAstraG3/98bis2/04,OpelZafiraA4/99bis6/05:Sowird'sgemacht-Band113
RüdigerEtzold
(0/5)
Kostenlos
VWPassat7von11/10bis10/14:Sowird'sgemachtBand157
RüdigerEtzold
(2.5/5)
Kostenlos
AutodeskInventor2019-Belastungsanalyse(FEM):VielepraktischeÜbungenamKonstruktionsobjektRADLADER
ChristianSchlieder
(0/5)
Kostenlos
ÄhnlicheHörbücher
Kostenlosmiteiner30-tägigenTestversionvonScribd
Alleanzeigen
KoiKarpfenhalten:Koi-Haltungleichtgemacht–GrundlegendeszurartgerechtenHaltungvonKois
MarkHusemeyer
(0/5)
Kostenlos
Heißzeit:MitVollgasindieKlimakatastrophe-undwiewiraufdieBremsetreten
MojibLatif
(0/5)
Kostenlos
DasliebeAuto-GeschichtenvonSchüsselnundFlitzern(ungekürzt)
HansEckartRübersamen
(0/5)
Kostenlos
ÖlundGas-ImNetzderKonzerne
GerhardKonzelmann
(0/5)
Kostenlos
LeanProduction-Grundlagen:DasPrinzipderschlankenProduktionverstehenundinderPraxisanwenden.SchlankzurWertschöpfung!
MaximilianTündermann
(0/5)
Kostenlos
LeanManagementfürEinsteiger:ErfolgsfaktorenvonLeanManagement–LeanLeadership&Co.alslangfristigeErfolgsgaranten
MaximilianTündermann
(4.5/5)
Kostenlos
DieAutodoktoren-ZweidrehenamRad:DiebestenGeschichtenausderWerkstatt(UngekürzteLesung)
Hans-JürgenFaul
(0/5)
Kostenlos
ShopfloorManagementfürEinsteiger:ErsteSchrittezueinerwertschöpfungsorientiertenFührung.TheoretischeGrundlagen,-begriffeundpraktischeToolszurEinführunginKMUs
MalteSchechler
(0/5)
Kostenlos
ElonMusk:WieElonMuskdieWeltverändert–DasungekürzteHörbuch
AshleyVance
(4.5/5)
Kostenlos
DerZauberderWirklichkeit-DiefaszinierendeWahrheithinterdenRätselnderNatur(Ungekürzt)
RichardDawkins
(5/5)
Kostenlos
ElonMusk:WieElonMuskdieWeltverändert–DieBiografie
AshleyVance
(0/5)
Kostenlos
DieVerantwortlicheElektrofachkraft:VEFK-StrukturundBetrieblicheElektrosicherheitfürUnternehmer,FachundFührungskräfte
MatthiasSurovcik
(0/5)
Kostenlos
DerGeistinderMaschine:KünstlicheIntelligenzundmenschlichesLeben
FrankfurterAllgemeineArchiv
(0/5)
Kostenlos
Ragazzamotorizzata:AufeinerhalbenVespaumganzItalien
NatiRasch
(0/5)
Kostenlos
GeplanteObsoleszenz
DawidHeftmann
(0/5)
Kostenlos
Raumfahrt:WohinwilldieMenschheit?
FrankfurterAllgemeineArchiv
(0/5)
Kostenlos
BasicofAIAcceleratorDesignusingVerilogHDL
1.
BasicofAI
AcceleratorDesign
usingVerilogHDL
JoohanKIM
Ver.20200512
https://blog.naver.com/chacagea
2.
•UnderstandthekeyknowledgeforDNNs
•UnderstandthetrendtoimproveDNNs
•BeabletodesignCNNCoreusingVerilogHDL
•BeabletothedevelopmentflowforHWDesign
•Youwillbeinterestedinhardwareaccelerateddesign!!
ParticipantTakeaways
https://blog.naver.com/chacagea
3.
•TrainingResources
•https://github.com/matbi86/01_ai_accelerator_basic_for_student
•QnA
•https://blog.naver.com/chacagea/memo/221865835735
•ShovelingLog!!
•https://blog.naver.com/chacagea
Resources
https://blog.naver.com/chacagea
4.
Theory:BasicofDeepLearning
•BackgroundofDeepNeuralNetworks
•OverviewofDeepNeuralNetworks
•Perceptron
•DeepNeuralNetwork(DNN)
•Inferencevs.Training
•WhyStudyCNN?
•ImageClassification
•SuperResolution
•GenerativeAdversarialNetworks(GAN)
•UnderstandofConvolutionNeuralNetwork
•Channel
•Stride
•Padding
•Pooling
Training:CNNOperationCodingwithC
•HowtouseVim/GCC
•CNNCoreCCoding.(HWwillbeimplementedwiththiscode.)
Contents(Day1)
https://blog.naver.com/chacagea
5.
Theory:UnderstandingCNNandHWImplementation
•SurveyofDNNDevelopmentResources
•PopularDNNs
•LeNet(1998)
•AlexNet(2012)
•OverFeat(2013)
•VGGNet(2014)
•GoogleNet(2014)
•ResNet(2015)
•Frameworks
•DataSets
•UnderstandofCNN(Advanced)
•CPUvsGPUvsFPGAvsASIC(WhyuseHW?)
Training:VivadoSimulationEnvironmentTest
•IntroduceVivado
•4-bitcounterdesignandsimulation.
Contents(Day2)
https://blog.naver.com/chacagea
6.
Theory:CNNCoreDesignusingVerilogHDL
•ShortReviewofVerilogHDL
•RTL
•Parameter
•Generate
•IndexedPartSelect
•CNNCoreSpec
•CNNCoreHWArchitecture
Training:CNNCoreDesignusingVerilogHDL
•CNNDesignwithVerilogHDL
•CNNDesignReview
Contents(Day3)
https://blog.naver.com/chacagea
7.
Day1Theory
BasicofDeep
Learning
Ver.20200512
https://blog.naver.com/chacagea
8.
Theory:BasicofDeepLearning
•BackgroundofDeepNeuralNetworks
•OverviewofDeepNeuralNetworks
•Perceptron
•DeepNeuralNetwork(DNN)
•Inferencevs.Training
•WhyStudyCNN?
•ImageClassification
•SuperResolution
•GenerativeAdversarialNetworks(GAN)
•UnderstandofConvolutionNeuralNetwork
•Channel
•Stride
•Padding
•Pooling
Training:CNNOperationCodingwithC
•HowtouseVim/GCC
•CNNCoreCCoding.(HWwillbeimplementedwiththiscode.)
Contents(Day1)
https://blog.naver.com/chacagea
9.
BackgroundofDeepNeuralNetworks
https://blog.naver.com/chacagea
http://eyeriss.mit.edu/tutorial.html
10.
ArtificialIntelligence
https://blog.naver.com/chacagea
11.
AIandMachineLearning
https://blog.naver.com/chacagea
12.
Brain-InspiredMachineLearning
https://blog.naver.com/chacagea
13.
HowDoestheBrainWork?
https://blog.naver.com/chacagea
14.
Spiking-basedMachineLearning
https://blog.naver.com/chacagea
15.
SpikingArchitecture
https://blog.naver.com/chacagea
16.
MachineLearningwithNeuralNetworks
https://blog.naver.com/chacagea
17.
NeuralNetworks:WeightedSum
https://blog.naver.com/chacagea
18.
ManyWeightedSums
https://blog.naver.com/chacagea
19.
DeepLearning
https://blog.naver.com/chacagea
20.
WhatisDeepLearning?
https://blog.naver.com/chacagea
•NumberofLayer:5~over1000
•DNN(DeepNeuralNetworks)
•VisualizingCNN
•low-levelfeatures/higherlevelfeatures
21.
WhyisDeepLearningHotNow?
https://blog.naver.com/chacagea
22.
ImageNetChallenge
https://blog.naver.com/chacagea
23.
ImageNet:ImageClassificationTask
https://blog.naver.com/chacagea
24.
GPUUsageforImageNetChallenge
https://blog.naver.com/chacagea
25.
DeepLearningonGames
https://blog.naver.com/chacagea
26.
EmergingApplications
https://blog.naver.com/chacagea
•Medical(CancerDetection,Pre-Natal)
•Finance(Trading,EnergyForecasting,Risk)
•Infrastructure(StructureSafetyandTraffic)
•WeatherForecastingandEventDetection
•Self-drivingCars
27.
Opportunities
https://blog.naver.com/chacagea
FromEETimes–September27,2016
”Todaythejoboftrainingmachinelearningmodelsis
limitedbycompute,ifwehadfasterprocessorswe’d
runbiggermodels…inpracticewetrainonareasonable
subsetofdatathatcanfinishinamatterofmonths.We
coulduseimprovementsofseveralordersofmagnitude
–100xorgreater.”
–GregDiamos,SeniorResearcher,SVAIL,Baidu
28.
OverviewofDeepNeuralNetworks
https://blog.naver.com/chacagea
29.
DNNTimeline
https://blog.naver.com/chacagea
30.
SoManyNeuralNetworks!
https://blog.naver.com/chacagea
http://www.asimovinstitute.org/neural-network-zoo/
31.
Perceptron
https://blog.naver.com/chacagea
퍼셉트론이란?
다수의신호를입력으로받아하나의신호를출력하는것.
AND
(w1,w2,세타)=(0.5,0.5,0.7),(0.5,0.5,0.8)또는(1.0,1.0,1.0)
NAND
(w1,w2,세타)=(-0.5,-0.5,-0.7),(-0.5,-0.5,-0.8)또는(-1.0,-1.0,-1.0)
OR
(w1,w2,세타)=(0.3,0.3,0.5)
똑같은구조의퍼셉트론에서매개변수의값을통해다양한
논리값을표현할수있다.
https://ko.wikipedia.org/wiki/%ED%8D%BC%EC%85%89
%ED%8A%B8%EB%A1%A0
32.
ProblemofPerceptron
https://blog.naver.com/chacagea
SingleLayerPerceptron으로는XOR를표현할수없다.
MultiLayerPerceptron
Perceptron의Layer가쌓이면non-linear적인문제를해결할수있습니다.
복잡한문제를해결하기위해서는Non-Linearity가중요합니다.
SingleLayerPerceptron
33.
ActivationFunction
https://blog.naver.com/chacagea
34.
DNNTerminology101
https://blog.naver.com/chacagea
Neurons
Synapses
35.
DNNTerminology101
https://blog.naver.com/chacagea
36.
DNNTerminology101
https://blog.naver.com/chacagea
37.
DNNTerminology101
https://blog.naver.com/chacagea
38.
DNNTerminology101
https://blog.naver.com/chacagea
39.
DNNTerminology101
https://blog.naver.com/chacagea
40.
DNNTerminology101
https://blog.naver.com/chacagea
41.
DNNTerminology101
https://blog.naver.com/chacagea
MatrixDotProduct
Bias
Layer1Layer2Layer3
42.
PopularTypesofDNNs
https://blog.naver.com/chacagea
43.
Inferencevs.Training
https://blog.naver.com/chacagea
44.
Inferencevs.Training
https://blog.naver.com/chacagea
45.
WhyStudyCNN?
https://blog.naver.com/chacagea
46.
ImageClassification
https://blog.naver.com/chacagea
https://becominghuman.ai/building-an-image-classifier-
using-deep-learning-in-python-totally-from-a-
beginners-perspective-be8dbaf22dd8
47.
SuperResolution
https://blog.naver.com/chacagea
https://awesomeopensource.com/project/limbee/NTIRE2
017
EnhancedDeepResidualNetworksforSingleImage
Super-Resolution
48.
SuperResolution(EDSR)
https://blog.naver.com/chacagea
https://awesomeopensource.com/project/limbee/NTIRE2
017
49.
SuperResolution(EDSR)
https://blog.naver.com/chacagea
https://awesomeopensource.com/project/limbee/NTIRE2
017
50.
GenerativeAdversarialNetworks(GAN)
https://blog.naver.com/chacagea
https://www.freecodecamp.org/news/an-intuitive-
introduction-to-generative-adversarial-networks-gans-
7a2264a81394/
51.
GenerativeAdversarialNetworks(GAN)
https://blog.naver.com/chacagea
https://www.youtube.com/watch?v=C1YUYWP-6rE
4:00
52.
GenerativeAdversarialNetworks(GAN)
https://blog.naver.com/chacagea
https://hoya012.github.io/blog/SIngle-Image-Super-
Resolution-Overview/
53.
UnderstandofConvolutionNeuralNetwork
https://blog.naver.com/chacagea
54.
MNIST
https://blog.naver.com/chacagea
MNISTDataBase(ModifiedNationalInstituteofStandardsandTechnologydatabase)
-HandWriteImage
-28x28Pixel
-TrainingSet:60,000,TestSet:10,000
55.
ConvolutionalNeuralNetworks
https://blog.naver.com/chacagea
CNN(ConvolutionNeuralNetwork)
http://taewan.kim/post/cnn/
Kernelsize:Kx*Ky
Featuremapsize:X*Y
ChannelDepth:M(inputchannel)*N(outputchannel)
56.
ConvolutionalNeuralNetworks
https://blog.naver.com/chacagea
ReasonstouseConvolutioninImagefield.
-2DImage
-NeighborPixelsimilarity
57.
Channel
https://blog.naver.com/chacagea
-Domain
-MoreInformation
58.
Stride
https://blog.naver.com/chacagea
http://cs231n.github.io/convolutional-networks/
-ReducedFeatureMapsize
59.
Padding
https://blog.naver.com/chacagea
-Tomaintainfeaturemapsize
-ImproveAccuracy
60.
Pooling
https://blog.naver.com/chacagea
-ReducedFeatureMapsize
-KeepingAccuracy
延伸文章資訊
- 1Design and implementation of a hardware accelerator for ...
Un primo ringraziamento va ai miei relatori, il professore Guido Masera e il ... in our case will...
- 2FPGA-based Accelerators of Deep Learning Networks ... - arXiv
of artificial intelligence, deep learning, has emerged, and has demonstrated its ... Therefore, a...
- 3How to make your own deep learning accelerator chip!
AI Landscape by Shan Tang : Source. Making any chip (ASIC, SOC etc) is a costly, difficult and le...
- 4IBM/AccDNN: A compiler from AI model to RTL ... - GitHub
A compiler from AI model to RTL (Verilog) accelerator in FPGA hardware with auto design space exp...
- 5Tutorial on Hardware Accelerators for Deep Neural Networks
Deep neural networks (DNNs) are currently widely used for many AI applications including computer...