djupinlärning
Djupinlärning är en gren av maskininlärning som använder artificiella neurala nätverk med flera lager för att modellera komplexa mönster i data. Genom att lära sig hierarkiska representationer kan modellen fånga abstrakta samband som är svåra att nå med enklare metoder. Träningen sker vanligtvis genom backpropagation och gradientnedstigning, där nätverkets vikter justeras för att minimera en förlustfunktion. Djupinlärning förutsätter ofta stora datamängder och betydande beräkningsresurser.
Historiskt utvecklades neurala nätverk under 1940–talen och 1980-talet när backpropagation blev standard. En djupare våg började
Vanliga arkitekturer inkluderar konvolutionella neurala nätverk CNNs för bilder, rekurrenta nätverk RNNs och LSTM/GRU för sekvensdata,
Användningsområden omfattar datorseende, taligenkänning, maskinöversättning, textgenerering, medicinsk bilddiagnostik, robotik och spel. Djupinlärning har även bidragit till
Begränsningar och utmaningar inkluderar behov av stora dataset, risk för överfitting utan rätt regularisering, bristande tolbarhet
Forskningen fortsätter inom effektivare träning, självövervakad eller kontrastbaserad inlärning, multimodala modeller och metoder för ökad transparens