INFORMATIKAI KAR DOKTORI PROGRAM
SZIGORLATI TEMATIKA

Számítógépes látás


A háromdimenziós számítógépes látás területei és feladatai: 3D-s objektumok modellezése és leírása, színtér-rekonstrukció sztereó képekbõl és más képi adatok alapján (shape from X), mozgáselemzés, mozgás alapú objektum-rekonstrukció (structure from/and motion), felismerés, detektálás, pozíció-meghatározás, textúra-analízis.
Matematikai alapok: numerikus módszerek, projektív geometria alapjai, térbeli transzformációk (euklideszi, affin), differenciál geometria alapjai, spline-ok, lineáris algebra, szinguláris érték dekompozíció (SVD), valószínûség-számítás alapjai, robusztus statisztikák és becslési módszerek (Least Median of Squares, Least Trimmed Squares, RANSAC), a Kálmán szûrés elvei, klaszterezési alapok, fõkomponens analízis (PCA).
Digitális képek, a képalkotás alapjai, felbontás és részletesség (scale), a scale space fogalma, a projektív geometria alapjai, kamera modellek (perspektív, gyenge perspektív, affin), külsõ és belsõ kamera paraméterek, a kamera-kalibrálás elvei.
Lokális képi jellemzõk (sajátságok), vonalak, görbék. Élek, sarkok, vonalak detektálása, Canny éldetektáló, Hough transzformáció, aktív kontúrok.
Sztereó látás, megfeleltetés (correspondence) és 3D-s rekonstrukció, ritka illesztés (sparse matching), képi jellemzõk megfeleltetése, korrelációs módszerek, az epipoláris geometria és a fundamentális mátrix, becslésük, a takarás és a zaj kezelése, robusztus módszerek, rektifikálás, sûrû illesztés (dense matching), trianguláció, a projektív, az affin és az euklideszi rekonstrukció.
Más rekonstrukciós és mérési módszerek: Shape from shading, fotometrikus sztereó, shape from texture, aktív módszerek, shape from contours, strukturált fény, távolság-kép (range image), lézer szkennerek, mért felületek összeillesztése, regisztráció, az ICP algoritmus, robusztus változatai.
Mozgáselemzés, merev objektumok mozgása, az optikai áramlás (optical flow), a normál és a teljes áramlás-vektor, további megkötések (constraints), az optikai áramlás meghatározása, jellemzõpont alapú mozgás-követés, a Kanade-Lucas-Tomasi mozgáskövetõ (KLT Tracker) mûködési elvei, mozgás alapú objektum-rekonstrukció, a Tomasi-Kanade faktorizáció, a Kálmán szûrõ és a mozgáskövetés.
Felismerés, invariánsok, látvány-alapú (appearance-based) módszerek, képi sajátterek, sajáttér-reprezentáció, modell-alapú felismerés és pozíció-meghatározás, pontok és vonalak illesztése, pozíció-meghatározás perspektív és gyenge perspektív esetben.
A számítógépes látás alkalmazásai: ipari (szerelés, minõség-ellenõrzés), reverse engineering, orvosi (MRI, CT), figyelés és biztonság, emberi arcok és mozgások felismerése és modellezése, forgalom-irányítás, intelligens robotok és jármûvek, képi és videó adatbázisok, mûvészeti tárgyak valósághû modellezés.


Irodalom:

E.Trucco, A.Verri, Introductory Techniques for 3-D Computer Vision, Prentice Hall, 1998.
M.Sonka, V.Hlavac, R.Boyle, Image Processing, Analysis and Machine Vision, PWS Publishing, 2nd edition, 1999.
R.Hartley, A.Zisserman, Multiple View Geometry in Computer Vision, Cambridge University Press, 2000.
L.S.Shapiro, Affine Analysis of Image Sequences, Cambridge University Press, 1995.
A.Blake, M.Isard, Active Contours, Springer-Verlag London, 1998.
R.M.Haralick, L.G.Shapiro, Computer and Robot Vision, Addison-Wesley, volumes I-II, 1992-1993.
B.Jahne, Digital Image Processing, Springer, 1997 (vagy késõbbi kiadás).
P.J.Rousseeuw, A.M.Leroy, Robust Regression and Outlier Detection, John Wiley & Sons, 1987.
A.K.Jain, R.C.Dubes, Algorithms for Clustering Data, Prentice Hall, 1988.