기계 학습 비전 및 언어처리 랩

관련기사 바로가기

우리 연구실은 사람의 가장 효과적인 소통 수단인 시각, 자연어, 그리고 음성을 통해 사람의 지능을 이해하고 구현하는 기계 학습 모델을 연구하고 있습니다. 구체적으로는, 멀티모달 학습, 생성 모델, 심층 학습을 연구하고 있고, 연구 주제들은 문자에서 영상 및 동영상 생성, Embodied AI, 멀미모달 대화 모델, 동영상 이해 및 QA 모델, 이해가능한 인공지능 등이 있습니다.
Our lab aims to help understanding and implement human intelligence for most common communication media: vision, natural language, and speech. Since they are connected and correlated to each other, we work on developing effective and efficient machine learning models for multi-modalities.

In Machine learning, Vision & Language lab, we are interested in Machine Learning and applications to Computer Vision and Language Processing. Specifically, we work on Multimodal Learning, Generative Models, and Deep Learning and our research topics include (but not limited to) embodied AI, text-to-image generation, multi-modal conversational models, video understanding and question answering, and explainable AI.

Major research field

멀티모달 학습, 생성 모델, 기계학습, 심층 학습 / Multimodal Learning, Generative Models, Machine Learning, and Deep Learning

Desired field of research