안녕하세요, 저는
문제를 정의하고 효과적으로 개선하는데 집중하는 주니어 AI 엔지니어입니다.
새로운 기술에 흥미를 느끼며, 실제 연구와 프로젝트로 문제를 해결합니다.
논문으로 검증하고, 경진대회 성과로 증명하는 AI 연구자 김찬기입니다. 학부생 신분으로 국제 SCIE급 저널 투고를 완료했으며, 국내외 AI 경진대회에서도 상위권 입상 경력을 보유하고 있습니다. 이론과 실전을 오가며 결과를 만들어내는 것을 즐깁니다.
현재 경상국립대학교 생명정보지능연구실(Bii LAB)에서 Multi-Agent Orchestartion을 통한 다양한 도메인의 문제 해결 연구에 몰두하고 있습니다. 복잡한 문제를 작은 단위로 분해해 효율적으로 풀어내는 구조에 관심이 많으며, 한정된 자원으로 최대 성능을 이끌어내는 문제를 특히 즐깁니다.
KCI 등재 1편, 국내 학술대회 4편 — 학부생으로서 꾸준히 연구 실적을 쌓아왔으며, KCC 우수논문상, KSC 장려상 수상과 함께 데이터 경진대회 입상 이력도 보유하고 있습니다.
경상국립대학교 생명정보지능연구실 (Bii LAB)
경상국립대학교 IDEA LAB
LINC 3.0 산학공동기술개발과제
경상국립대학교 IDEA LAB
경상국립대학교 (GNU)
동적 라우팅으로 여러 의료 특화 LLM을 최적 조합하여 진단 정확도를 극대화하는 Multi-Agent 시스템 연구
비교적 소형 LLM들의 Multi-Agent 협업으로 개발자의 커리어 성장을 지원하는 시스템 연구
Self-Attention 기반 이미지와 텍스트가 결합된 복잡한 정보 다각도 추출 및 통합 파이프라인 설계 및 구축
슬라이딩 윈도우 알고리즘 기반으로 학습 데이터 수를 조정하여 학습하는 방법 제안 및 카모플라쥬 치료 시스템의 배터리 효율 극대화
식물의 이미지 데이터와 센서 기반 환경 정보 시계열 데이터로 구성된 멀티모달 데이터를 효과적으로 학습하는 CNN-Transformer 구조 제안
환자 건강 예측 정확도 향상과 진단 시간 감소를 위한 방법론 제안 및 상관관계 기반 특징 선택으로 모델 효율 개선
2025 상반기 헥토 채용 AI 경진대회
Hecto
Hecto 인재풀 등록 성과 달성
데이터 분석을 통한 전기차 가격 예측 모델 개발 경진대회
DACON
전체 참가 팀 중 2등 수상
건설장비에서 작동오일의 상태를 실시간으로 모니터링하기 위한 오일 상태 판단 모델 개발
AWS · 현대인프라코어
학생팀 기준 입상권 달성
새로운 기회, 협업, 또는 단순한 인사도 환영합니다.
언제든지 편하게 연락 주세요.
비교적 소형 LLM들을 유기적으로 조합해 개발자의 커리어 성장을 지원하는 챗봇 시스템을 연구하고 있습니다. 정보 분석, 경력 추천, 결과 검증처럼 서로 다른 역할을 맡은 에이전트들이 협업하도록 설계했으며, 이를 통해 단일 모델만으로는 만들기 어려운 구조적이고 신뢰도 높은 커리어 지원 방식을 제안합니다.
이 연구는 개발자의 커리어 성장을 보다 효과적으로 지원할 수 있는 대화형 시스템을 만드는 데서 출발했습니다. 하나의 대형 모델에 모든 판단을 맡기기보다, 비교적 소형 LLM들이 각자의 전문 역할을 수행하며 협력하는 Multi-Agent Orchestration 구조를 통해 더 실용적이면서도 품질 높은 커리어 조언을 제공하는 아키텍처를 설계·구현하는 것을 목표로 했습니다.
정보 분석, 커리어 추천, 결과 검증 등 기능이 분명히 구분된 소형 LLM 에이전트들을 설계하고, 이들이 순차적으로 협업할 수 있도록 오케스트레이션 파이프라인을 구축했습니다. 특히 LangGraph 기반 Workflow를 적용해 사용자의 커리어 관련 질의를 단계적으로 해석하고, 각 에이전트의 판단을 연결해 최종 응답을 생성하도록 구현했습니다. 여기에 사용자 프로파일 정보를 함께 반영해, 보다 개인화된 피드백이 가능하도록 설계했습니다.
Multi-Agent Orchestration 기반 개발자 커리어 지원 시스템 구현
역할이 분리된 소형 LLM들의 협업 구조를 통해, 단일 대형 모델에 준하는 수준의 커리어 관련 응답 품질을 확인할 수 있었습니다. 또한 오케스트레이션 기반 협업이 응답의 일관성과 정확도를 높이는 데 유의미하게 기여함을 검증했습니다. 현재 본 연구는 Expert Systems With Applications (ESWA, SCIE 등재지)에 투고되어 심사가 진행 중입니다.
본 연구는 개발자 취업·이직 지원 플랫폼, 기술 스택 기반 채용 매칭 시스템, 개인화 학습 경로 추천 서비스 등 다양한 분야로 확장될 수 있습니다. 특히 소형 모델을 활용하는 구조이기 때문에 운영 비용 부담을 낮추면서도 실용적인 수준의 서비스 품질을 유지할 수 있어, 스타트업이나 중소기업 환경에서도 충분히 도입 가능한 현실적인 대안이 될 수 있습니다.
단일 LLM이 모든 의료 진단 유형을 잘 다루지는 못한다는 문제의식에서 출발. 여러 의료 특화 LLM의 강점을 동적으로 파악하고 조합하여 진단 정확도를 극대화하는 적응형 라우팅 시스템을 연구 중.
의료 AI에서 단일 LLM이 외과·내과·신경과 등 모든 진단 영역을 균일하게 잘 다루는 경우는 드뭅니다. 각 모델은 특정 역할에서 두각을 나타내는 반면, 다른 영역에서는 상대적으로 취약한 비대칭 능력 분포를 가집니다. 이 연구는 그 비대칭성을 측정하고, 쿼리에 따라 가장 잘 맞는 모델 조합을 자동으로 구성하는 라우팅 시스템을 탐구합니다.
SNS에서 확산되는 유해 밈은 이미지와 텍스트가 함께 의미를 형성하기 때문에, 한 가지 모달만으로는 맥락을 충분히 포착하기 어렵습니다. 이에 이미지와 텍스트 표현을 유기적으로 결합하는 Self-Attention 기반 멀티모달 통합 모델을 설계했고, 단일 모달 접근 대비 더 높은 탐지 성능을 확인했습니다. 본 연구는 KCC 2025에서 일반부문 우수논문상을 수상했습니다.
유해 밈은 이미지와 텍스트가 결합되어 의미를 만들어내는 대표적인 멀티모달 콘텐츠로, 어느 한쪽 정보만으로는 공격적이거나 혐오적인 의도를 정확히 판단하기 어렵습니다. 이 연구는 두 모달의 상호작용을 함께 이해할 수 있는 모델을 통해, SNS 환경에서 유해 밈을 보다 정교하게 탐지할 수 있는 멀티모달 AI 시스템을 구현하는 것을 목표로 했습니다.
이미지는 Vision Transformer(ViT) 기반 인코더로, 텍스트는 BERT 및 RoBERTa 계열 인코더로 각각 표현을 추출한 뒤, Self-Attention 기반 Cross-Attention 모듈을 통해 두 모달의 정보를 동적으로 융합했습니다. 이를 통해 이미지와 텍스트가 서로의 의미를 어떻게 보완하거나 왜곡하는지를 함께 반영할 수 있도록 설계했습니다. 실험은 표준 Hateful Memes Dataset을 기반으로 진행했으며, 단일 모달 모델과 단순 결합 방식 등 다양한 베이스라인과 성능을 비교했습니다.
Self-Attention 기반 이미지-텍스트 통합 멀티모달 탐지 파이프라인
제안한 통합 모델은 이미지 전용, 텍스트 전용 모델은 물론 단순 결합(Concatenation) 방식과 비교했을 때, 유해 밈 탐지 성능에서 일관된 향상을 보였습니다. 특히 AUROC와 Accuracy 지표에서 의미 있는 개선을 확인했고, 멀티모달 정보의 상호작용을 정교하게 반영하는 구조가 실제 탐지 성능 향상에 효과적임을 검증했습니다. 이러한 성과를 바탕으로 KCC 2025 한국컴퓨터종합학술대회에서 일반부문 우수논문상을 수상했습니다.
본 연구는 SNS 플랫폼의 자동 콘텐츠 모더레이션, 아동·청소년 보호를 위한 유해 콘텐츠 필터링, 온라인 혐오 표현에 대한 조기 탐지 및 대응 시스템 등 다양한 서비스에 적용될 수 있습니다. 나아가 이미지와 텍스트가 결합된 복합 콘텐츠를 다루는 실시간 안전성 검사 환경에서도 활용 가능성이 높아, 실제 플랫폼 운영 측면에서도 충분한 확장성을 갖는 접근이라고 볼 수 있습니다.
카모플라쥬 치료 시스템의 안정적인 운용을 위해, 배터리 잔존 수명(RUL)을 보다 정교하게 예측하는 시계열 모델을 연구했습니다. Sliding Window 기반 데이터 구성과 LSTM을 결합해 배터리 상태 변화의 장기 패턴을 효과적으로 반영하고자 했으며, 이를 통해 시스템 운용 안정성과 배터리 관리 효율을 함께 높일 수 있는 방법을 제안했습니다.
카모플라쥬 치료 시스템은 피부 치료를 위한 의료 광원 장치로, 안정적인 전력 공급이 장비 운용의 핵심 조건입니다. 배터리 상태를 제때 파악하지 못하면 장비의 성능 저하나 예기치 않은 운용 중단으로 이어질 수 있기 때문에, 배터리 잔존 수명(Remaining Useful Life, RUL)을 보다 정확하게 예측해 교체 시점을 최적화하고 시스템의 신뢰성을 높이는 것이 이 연구의 출발점이었습니다.
배터리 충·방전 시계열 데이터에 Sliding Window 알고리즘을 적용해 다양한 길이의 학습 샘플을 구성하고, 이를 통해 학습 데이터의 양과 다양성을 함께 확보했습니다. 이후 LSTM(Long Short-Term Memory) 모델을 활용해 배터리 상태 변화에 내재된 장기 의존성을 학습하도록 설계했으며, 윈도우 크기에 따른 예측 성능 차이를 체계적으로 비교해 최적의 설정을 도출했습니다. 또한 GRU, Vanilla RNN 등 다른 시계열 모델과의 비교 실험을 통해 제안 방식의 효과를 검증했습니다.
LSTM 학습 데이터 80% 구간에서의 SoH 예측 결과
제안한 Sliding Window-LSTM 방법론은 기존 단순 LSTM 및 GRU 기반 접근과 비교했을 때, 배터리 RUL 예측에서 MAE와 RMSE 기준으로 더 우수한 성능을 보였습니다. 특히 Sliding Window를 활용한 데이터 구성 방식이 모델의 일반화 성능을 높이는 데 실질적으로 기여함을 확인했으며, 배터리 상태 예측의 안정성과 정확도를 함께 개선할 수 있음을 실험적으로 입증했습니다. 본 연구는 한국정보기술학회논문지(KIIT)에 게재되어 KCI에 등재되었습니다.
이 연구는 의료 장비의 배터리 수명 예측과 교체 최적화는 물론, IoT 기반 웨어러블 디바이스, 전기차(EV), 산업용 로봇 및 드론과 같은 다양한 배터리 기반 시스템에도 적용될 수 있습니다. 나아가 예지보전(Predictive Maintenance) 관점에서 장비 운영 효율을 높이고 유지보수 비용을 줄이는 실용적인 접근으로 확장 가능성이 높습니다.
스마트팜 환경에서 발생하는 식물 피해는 초기 단계일수록 시각적 변화가 미세해, 이미지 정보만으로는 정확한 판단이 어려운 경우가 많습니다. 이에 식물 이미지와 온·습도·조도 등 환경 센서 시계열 데이터를 함께 활용하는 CNN-Transformer 기반 멀티모달 진단 구조를 설계했고, 단일 모달 접근보다 더 정교한 미세 피해 탐지가 가능함을 확인했습니다. 본 연구는 KSC 2022 학부생부문 장려상을 수상했습니다.
이 연구는 스마트팜 환경에서 병해충이나 생육 이상으로 인한 식물 피해를 보다 이른 시점에 정밀하게 탐지하기 위해 시작되었습니다. 초기 피해는 육안으로 구분하기 어렵고, 단일 이미지 분석만으로는 환경적 맥락까지 반영하기 어렵기 때문에, 시각 정보와 환경 센서 데이터를 함께 해석하는 멀티모달 진단 시스템을 통해 작물 손실을 줄이고 보다 선제적인 대응이 가능하도록 하는 것을 목표로 했습니다.
식물 이미지는 CNN(Convolutional Neural Network)을 활용해 외형과 질감 등 공간적 특징을 추출하고, 온도·습도·조도와 같은 환경 센서의 시계열 데이터는 Transformer의 Self-Attention 구조로 분석해 시간적 패턴을 반영했습니다. 이후 두 모달의 정보를 결합하는 CNN-Transformer 하이브리드 아키텍처를 설계해, 시각적으로는 유사하지만 환경 조건에 따라 다르게 나타나는 피해 양상까지 함께 구분할 수 있도록 했습니다. 실험은 병해충 피해 이미지와 동기화된 환경 데이터셋을 기반으로 수행했으며, 단일 모달 모델과의 비교를 통해 성능을 검증했습니다.
CNN 기반 이미지 특징 추출과 Transformer 기반 센서 시계열 분석을 결합한 멀티모달 진단 구조
제안한 CNN-Transformer 하이브리드 모델은 단일 이미지 기반 CNN 모델과 비교했을 때 식물 피해 미세 진단 정확도에서 더 우수한 성능을 보였습니다. 특히 환경 센서 데이터를 함께 활용함으로써, 시각적으로 비슷해 보이는 피해 유형 사이의 구분 능력이 향상됨을 확인했습니다. 이를 통해 멀티모달 정보의 결합이 초기 피해 탐지의 정밀도를 높이는 데 효과적임을 실험적으로 입증했고, 그 결과 KSC 2022 한국소프트웨어종합학술대회 학부생부문 장려상을 수상했습니다.
본 연구는 스마트팜 자동화 관리 시스템, 농업용 IoT 기반 작물 건강 모니터링, 온실 및 식물원 통합 관리 솔루션 등으로 확장될 수 있습니다. 또한 정밀 농업(Precision Agriculture) 환경에서 병해충 조기 경보 시스템으로 활용할 수 있으며, 드론 기반 영상 수집 기술과 결합할 경우 더 넓은 재배 구역에 대한 광역 모니터링에도 적용 가능합니다.
의료 데이터는 변수 수가 많을수록 항상 좋은 성능으로 이어지지 않으며, 오히려 중복되거나 불필요한 특징이 모델의 효율을 떨어뜨릴 수 있습니다. 이에 태아 심음도 데이터를 대상으로 상관관계 기반 특징 선택 기법을 적용해 핵심 변수만 남기는 예측 모델을 설계했고, 정확도를 유지하면서도 모델 복잡도와 학습 부담을 줄일 수 있음을 확인했습니다. 본 연구는 KSC 2022에서 발표되었습니다.
이 연구는 태아 심음도(CTG, Cardiotocography) 데이터를 활용한 태아 건강 예측에서, 다수의 입력 변수 가운데 실제 예측에 의미 있게 기여하는 핵심 특징만을 효과적으로 선별하는 방법을 찾기 위해 시작되었습니다. 의료 데이터에서는 변수 수가 많아질수록 모델이 복잡해지고 해석성과 효율이 떨어질 수 있기 때문에, 예측 정확도를 최대한 유지하면서도 진단 시간과 계산 비용을 함께 줄일 수 있는 특징 선택 방법론을 제안하는 것이 목표였습니다.
태아 건강 데이터셋(Fetal Health Dataset)의 변수들 사이 상관관계를 피어슨 상관계수(Pearson Correlation) 기반으로 분석한 뒤, 예측 기여도가 낮거나 서로 중복된 정보를 담고 있는 특징들을 임계값 기준으로 제거했습니다. 이렇게 정제한 특징 집합과 원본 특징 집합을 각각 사용해 Random Forest, XGBoost 등 다양한 분류 모델을 학습시키고, 차원 축소 전후의 성능 차이를 비교함으로써 제안한 방법의 효과를 체계적으로 검증했습니다.
Point-Biserial Correlation 기반 특징 선택과 표준화·SMOTE를 포함한 데이터 전처리 파이프라인
상관관계 기반 특징 선택을 적용한 결과, 모델 입력 차원은 유의미하게 감소했음에도 전체 특징을 모두 사용할 때와 유사하거나 일부 경우 더 나은 분류 정확도를 보였습니다. 또한 학습 시간 단축과 모델 경량화 효과를 함께 확인할 수 있었으며, 이를 통해 제한된 연산 자원 환경에서도 실용적인 의료 예측 모델을 구현할 수 있음을 실험적으로 입증했습니다. 본 연구는 KSC 2022 한국소프트웨어종합학술대회에서 발표되었습니다.
본 연구는 임상 현장의 실시간 환자 상태 모니터링 시스템, 의료 빅데이터 분석을 위한 효율적인 전처리 파이프라인, 웨어러블 의료기기 기반 원격 건강 모니터링 서비스, 병원 EMR 데이터를 활용한 질병 예측 보조 시스템 등으로 확장될 수 있습니다. 특히 입력 변수 최적화가 중요한 의료 AI 환경에서, 정확도와 효율을 함께 고려한 실용적인 접근으로 활용 가능성이 높습니다.
Hecto 그룹이 운영한 채용 연계 AI 경진대회에서, 팀의 모델 설계와 데이터 전처리 파이프라인 구축을 주도하며 최종 25위/748팀(Top 3.3%)를 기록했습니다. 이를 통해 Hecto 인사팀 채용 풀 등록이라는 실질적인 성과로 이어졌고, 전체 과정에서 약 90% 수준의 기술 구현을 직접 담당했습니다.
이 대회의 핵심 평가지표는 Log Loss였기 때문에, 모델이 특정 클래스에 과도하게 확신하는 순간 점수가 크게 악화되는 구조였습니다. 여기에 실내·실외, 주간·야간 등 촬영 환경 차이로 인한 도메인 편차가 존재했고, 학습을 방해하는 노이즈 이미지까지 포함되어 있어 단순히 모델을 학습시키는 것만으로는 안정적인 성능을 확보하기 어려웠습니다.
문제를 단순히 모델 성능 경쟁으로 보기보다, 데이터 품질과 예측 안정성을 함께 다루는 방향으로 접근했습니다. 먼저 노이즈 이미지를 정리해 학습 신호를 안정화했고, 다양한 촬영 환경에 대응하기 위해 증강 조합을 체계적으로 탐색했습니다. 이후 여러 백본 모델의 앙상블과 TTA를 결합해 과신뢰 문제를 완화하고 예측을 보다 부드럽게 만드는 전략을 적용했습니다.
그 결과 748팀 중 최종 25위(Top 3.3%)를 기록했고, Hecto 인사팀 채용 풀에 직접 등록되는 성과를 얻었습니다. 단순히 순위만 높인 것이 아니라, 데이터 정제부터 실험 설계, 모델 조합, 추론 안정화까지 전 과정을 주도적으로 설계했다는 점에서 실제 문제 해결 역량을 입증한 프로젝트였습니다. 팀 내 기술 기여도는 약 90%였습니다.
전기차 관련 정형 데이터를 활용한 가격 예측 문제에서, 복잡한 딥러닝이나 대규모 앙상블 없이도 단순한 모델과 전처리만으로 얼마나 경쟁력 있는 성능을 만들 수 있는지를 검증했습니다. 최소한의 구성으로도 높은 재현성과 안정성을 확보하는 데 집중했고, 그 결과 Private LB 3위, 최종 2위를 기록했습니다.
이 과제는 전기차 관련 정형 데이터를 바탕으로 차량 판매 가격을 예측하는 회귀 문제였습니다. 단순히 성능만 높이는 것이 아니라, 복잡한 딥러닝 구조나 무거운 앙상블 없이도 충분히 강력한 결과를 만들 수 있는지 직접 검증해보는 데 의미를 두었습니다. 다시 말해, 과도한 복잡성보다 견고한 베이스라인의 힘을 증명하는 것이 핵심 목표였습니다.
여러 복잡한 전처리와 모델 조합을 시도하기보다, 실제로 점수에 기여하는 단순한 구성을 끝까지 밀어붙이는 전략을 선택했습니다. 불필요한 실험 가지를 줄이고, 검증 가능한 설정을 빠르게 반복하면서 성능을 확인하는 방식으로 접근했습니다.
DecisionTreeRegressor와 MinMaxScaler라는 비교적 단순한 조합만으로도 Private LB 3위, 최종 2위(점수 1.18159)를 달성했습니다. 복잡한 앙상블 없이 단일 모델 기반 접근으로 상위권 성과를 만들었다는 점에서, 좋은 베이스라인 설계와 빠른 실험 판단의 중요성을 분명하게 보여준 프로젝트였습니다. 데이터 전처리부터 실험 설계, 제출 전략까지 전 과정을 단독으로 수행했습니다.
건설기계 오일 센서 데이터를 바탕으로 정상·이상 상태를 분류하는 문제에서, 일반적으로 딥러닝에 주로 쓰이는 Knowledge Distillation을 머신러닝 방식에 맞게 변형 적용했습니다. 특히 학습 데이터와 예측 데이터 사이의 피처 수가 크게 다른 제약을 해결하는 데 집중했고, 그 결과 517팀 중 21위(Top 4.1%)로 학생 팀 기준 입상권에 진입했습니다.
이 대회는 단순한 분류 문제처럼 보였지만, 실제로는 해결해야 할 제약이 분명한 과제였습니다. 무엇보다 Knowledge Distillation을 반드시 활용해야 한다는 조건이 있었고, 더 큰 문제는 학습 데이터와 예측 데이터의 피처 구성이 크게 달랐다는 점이었습니다. 즉, 일반적인 방식으로는 학습한 모델을 그대로 테스트 환경에 적용하기 어려운 구조였습니다.
이 문제는 기존 기법을 그대로 적용하기보다, 제약 조건에 맞게 구조를 다시 설계하는 방식으로 접근했습니다. 전체 피처를 활용해 학습한 Teacher Model의 지식을 축약된 피처만 가진 Student Model에 전달하도록 구성했고, 이를 통해 피처 불일치 문제를 우회하면서도 분류 성능을 최대한 유지하고자 했습니다.
그 결과 517팀 중 21위(Top 4.1%)를 기록하며 학생팀 기준 입상권에 진입했습니다. 단순히 성적만 낸 것이 아니라, 딥러닝 중심 기법으로 알려진 Knowledge Distillation을 머신러닝 기반 문제에 맞게 변형해 적용하고, 피처 불일치라는 구조적 제약을 해결했다는 점에서 의미가 컸습니다. 팀 내 모델링 기여도는 약 90%였습니다.