Computer Architecture and Co-design Research Group

컴퓨터 시스템 아키텍처 연구실

관련기사 바로가기
컴퓨터 시스템 아키텍처 연구실

Computer Architecture and Co-design Research Group (CoCoLab) 에서는 다양한 인공지능 어플리케이션을 대상으로 컴퓨터 아키텍처와 하드웨어-소프트웨어 공동 설계를 연구합니다. 최근 대규모 언어 모델, 개인화 추천 시스템, 자율 주행 등 여러 분야에서 인공지능 알고리즘의 활용이 크게 확대됨에 따라, 높은 성능과 에너지 효율성을 동시에 제공하는 컴퓨터 시스템의 필요성이 갈수록 높아지고 있습니다. 본 연구실에서는 포괄적인 관점으로 엣지-디바이스부터 데이터센터의 모든 범위에서, 인공지능 모델의 특성을 런-타임, 메모리 시스템, 가속기 아키텍처와 같은 컴퓨터 시스템과 유기적으로 연결하는 인공지능 시스템을 연구합니다. 최근 연구 주제는 ‘대규모 언어모델 서빙을 위한 GPU 시스템과 클러스터 스케줄링 기법’, ‘개인정보 보호 인공지능을 위한 인공지능 가속기 아키텍처 설계’, 그리고 ‘메모리 근접 처리 (Processing-in-memory, PIM) 와 스토리지 내부 처리 (In-storage processing, ISP) 를 포함하는 데이터 근접 처리 기술’ 이 있습니다. 본 연구실에서는 실제 워크로드 기반의 프로토타이핑과 성능 평가를 통해, 컴퓨터 아키텍처 아이디어를 인공지능 시스템의 성능 및 확장성 그리고 에너지 효율성 향상으로 연결합니다.
Computer Architecture and Co-design Research Group (CoCoLab) conducts research in computer architecture and hardware-software co-design for a wide range of artificial intelligence (AI) applications. As AI algorithms are widely adopted across domains such as large language models (LLMs), personalized recommendations, and autonomous driving, the need for computing systems that deliver high performance and energy efficiency continues to grow. We study AI systems end-to-end, linking AI algorithms and model characteristics with runtimes, compilers, memory systems, and accelerator architectures from edge devices to data center clusters. Recent research topics include memory-efficient GPU systems and cluster-level scheduling for LLM serving, neural processing unit (NPU) architectures for privacy-preserving AI, and near-data processing, including processing-in-memory (PIM) and in-storage processing (ISP). By prototyping and evaluating complete systems on real AI workloads, we translate architectural ideas into practical improvements of AI systems in terms of performance, scalability, and energy efficiency.

Major research field

컴퓨터 아키텍처, 하드웨어-소프트웨어 공동 설계, 인공지능 가속기 설계, 데이터 근접 처리 시스템 설계

Desired field of research

인공지능 어플리케이션을 위한 고성능 고효율 컴퓨터 시스템 설계

Research Keywords and Topics

· 컴퓨터 아키텍처 및 시스템(Computer architecture and system)
· 인공지능을 위한 하드웨어-소프트웨어 공동설계(Hardware-software co-design for AI)
· 인공지능 가속기 디자인(Neural processing unit (NPU) design)
· 인-메모리 데이터 처리 구조 설계(Processing-in-memory (PIM) design)
· 엣지-디바이스 및 데이터 센터 스케일의 인공지능 시스템 설계(AI system design on edge-devices / datacenters)

Research Publications

· Yunjae Lee*, Juntaek Lim*, Jehyeon Bang, Eunyeong Cho, Huijong Jeong, Taesu Kim, Hyungjun Kim, Joonhyung Lee, Jinseop Im, Ranggi Hwang, Se Jung Kwon, Dongsoo Lee, and Minsoo Rhu, "Debunking the CUDA Myth Towards GPU-based AI Systems," IEEE/ACM International Symposium on Computer Architecture (ISCA), 2025
· Ranggi Hwang*, Jianyu Wei*, Shijie Cao, Changho Hwang, Xiaohu Tang, Ting Cao, and Mao Yang, "Pre-gated MoE: An Algorithm-System Co-Design for Fast and Scalable Mixture-of-Expert Inference," IEEE/ACM International Symposium on Computer Architecture (ISCA), 2024
· Ranggi Hwang*, Minhoo Kang*, Jiwon Lee, Dongyun Kam, Youngjoo Lee, and Minsoo Rhu, "GROW: A Row-Stationary Sparse-Dense GEMM Accelerator for Memory-Efficient Graph Convolutional Neural Networks," IEEE International Symposium on High-Performance Computer Architecture (HPCA), 2023

Patents

· Minsoo Rhu, Dongho Yoon, Beomsik Park, Ranggi Hwang, and Yoonhyuk Choi, "Accelerator and controlling method," 2022
· Minsoo Rhu, Minhoo Kang, Ranggi Hwang, and Jiwon Lee, "High performance computing system for accelerating deep learning based graph convolutional neural networks and method," 2021

국가과학기술표준분류

  • ED. 전기/전자
  • ED04. 반도체소자·시스템
  • ED0406. SoC

국가기술지도분류

  • 정보-지식-지능화 사회 구현
  • 010700. 고성능정보처리/저장 장치 기술

6T분류

  • IT 분야
  • 정보처리 시스템 및 S/W