KIM CHANKI

베타 운영 중 LLM · SaaS · AI Workflow

취업준비생이 자신의 이력서 약점, 채용공고와의 매칭 여부, ATS 적합도를 객관적으로 파악하기 어렵다는 문제를 해결하기 위해 직접 설계하고 운영 중인 AI SaaS 서비스입니다.

프로젝트 배경

취업 준비 과정에서 이력서의 객관적인 약점 파악, 채용공고와의 적합도 분석, ATS(지원자 추적 시스템) 관점에서의 피드백을 얻기 어렵다는 현실적인 문제에서 출발했습니다.

구현 내용

LLM 기반 이력서 분석, ATS 관점 피드백, 채용공고 매칭, 자기소개서 초안 생성, 면접 대비를 하나의 AI 워크플로우로 설계했습니다. 사용자 입력 문서를 구조화하고 분석 프롬프트, 결과 포맷, UX 흐름을 직접 설계·구현하여 웹 서비스로 운영하고 있습니다.

현재 상태

실제 사용자 피드백을 반영해 분석 결과 표현과 자기소개서 생성 흐름을 지속적으로 개선하고 있으며, 서비스 도메인 배포 및 베타 사용자 검증을 진행 중입니다.

상태

베타 운영 중

링크

sixsecond.org

기간

2026.03 — Present

분야

LLM · SaaS · AI Workflow

LLM SaaS AI Workflow Resume Analysis ATS

Bii LAB · 2025 — Under Review GDAO Graph-oriented Developer-support Agent

진행 중 Multi-Agent Orchestration · LLM

비교적 소형 LLM들을 유기적으로 조합해 개발자의 커리어 성장을 지원하는 챗봇 시스템을 연구하고 있습니다. 정보 분석, 경력 추천, 결과 검증처럼 서로 다른 역할을 맡은 에이전트들이 협업하도록 설계했으며, 이를 통해 단일 모델만으로는 만들기 어려운 구조적이고 신뢰도 높은 커리어 지원 방식을 제안합니다.

연구 목적

이 연구는 개발자의 커리어 성장을 보다 효과적으로 지원할 수 있는 대화형 시스템을 만드는 데서 출발했습니다. 하나의 대형 모델에 모든 판단을 맡기기보다, 비교적 소형 LLM들이 각자의 전문 역할을 수행하며 협력하는 Multi-Agent Orchestration 구조를 통해 더 실용적이면서도 품질 높은 커리어 조언을 제공하는 아키텍처를 설계·구현하는 것을 목표로 했습니다.

연구 내용 및 방법

정보 분석, 커리어 추천, 결과 검증 등 기능이 분명히 구분된 소형 LLM 에이전트들을 설계하고, 이들이 순차적으로 협업할 수 있도록 오케스트레이션 파이프라인을 구축했습니다. 특히 LangGraph 기반 Workflow를 적용해 사용자의 커리어 관련 질의를 단계적으로 해석하고, 각 에이전트의 판단을 연결해 최종 응답을 생성하도록 구현했습니다. 여기에 사용자 프로파일 정보를 함께 반영해, 보다 개인화된 피드백이 가능하도록 설계했습니다.

Multi-Agent Orchestration 기반 개발자 커리어 지원 시스템 구현

연구 결과

역할이 분리된 소형 LLM들의 협업 구조를 통해, 단일 대형 모델에 준하는 수준의 커리어 관련 응답 품질을 확인할 수 있었습니다. 또한 오케스트레이션 기반 협업이 응답의 일관성과 정확도를 높이는 데 유의미하게 기여함을 검증했습니다. 현재 본 연구는 Information and Software Technology (IST, SCIE 등재지, IF 4.3)에 투고되어 심사가 진행 중입니다.

활용 가능 방안

본 연구는 개발자 취업·이직 지원 플랫폼, 기술 스택 기반 채용 매칭 시스템, 개인화 학습 경로 추천 서비스 등 다양한 분야로 확장될 수 있습니다. 특히 소형 모델을 활용하는 구조이기 때문에 운영 비용 부담을 낮추면서도 실용적인 수준의 서비스 품질을 유지할 수 있어, 스타트업이나 중소기업 환경에서도 충분히 도입 가능한 현실적인 대안이 될 수 있습니다.

상태

IST(SCIE) 심사 중

분야

Multi-Agent Orchestration · LLM

LLM Multi-Agent Orchestration LangGraph Python

Bii LAB · 2025 – 2026 — Research in Progress Capability-Aware Adaptive Routing System for Medical AI

연구 진행 중 Multi-Agent Orchestration · Medical AI

단일 LLM이 모든 의료 진단 유형을 잘 다루지는 못한다는 문제의식에서 출발. 여러 의료 특화 LLM의 강점을 동적으로 파악하고 조합하여 진단 정확도를 극대화하는 적응형 라우팅 시스템을 연구 중.

연구 배경

의료 AI에서 단일 LLM이 외과·내과·신경과 등 모든 진단 영역을 균일하게 잘 다루는 경우는 드뭅니다. 각 모델은 특정 역할에서 두각을 나타내는 반면, 다른 영역에서는 상대적으로 취약한 비대칭 능력 분포를 가집니다. 이 연구는 그 비대칭성을 측정하고, 쿼리에 따라 가장 잘 맞는 모델 조합을 자동으로 구성하는 라우팅 시스템을 탐구합니다.

🔒

Research in Progress — Details Withheld 구체적인 방법론, 실험 설계, 중간 결과는 논문 제출 전까지 공개하지 않습니다. 해당 내용은 연구의 핵심 Novelty와 직결되어 있어, 게재 확정 후 전체 공개 예정입니다.

소속

Bii LAB (경상국립대)

상태

실험 진행 중

분야

Multi-Agent Orchestration · Medical AI

시작

2025.09 —

Multi-Agent Medical AI RAG LLM Routing Multi-Modal LangChain

2025.07 Multi-Modal · Vision 일반부문 우수논문상

SNS에서 확산되는 유해 밈은 이미지와 텍스트가 함께 의미를 형성하기 때문에, 한 가지 모달만으로는 맥락을 충분히 포착하기 어렵습니다. 이에 이미지와 텍스트 표현을 유기적으로 결합하는 Self-Attention 기반 멀티모달 통합 모델을 설계했고, 단일 모달 접근 대비 더 높은 탐지 성능을 확인했습니다. 본 연구는 KCC 2025에서 일반부문 우수논문상을 수상했습니다.

연구 목적

유해 밈은 이미지와 텍스트가 결합되어 의미를 만들어내는 대표적인 멀티모달 콘텐츠로, 어느 한쪽 정보만으로는 공격적이거나 혐오적인 의도를 정확히 판단하기 어렵습니다. 이 연구는 두 모달의 상호작용을 함께 이해할 수 있는 모델을 통해, SNS 환경에서 유해 밈을 보다 정교하게 탐지할 수 있는 멀티모달 AI 시스템을 구현하는 것을 목표로 했습니다.

연구 내용 및 방법

이미지는 Vision Transformer(ViT) 기반 인코더로, 텍스트는 BERT 및 RoBERTa 계열 인코더로 각각 표현을 추출한 뒤, Self-Attention 기반 Cross-Attention 모듈을 통해 두 모달의 정보를 동적으로 융합했습니다. 이를 통해 이미지와 텍스트가 서로의 의미를 어떻게 보완하거나 왜곡하는지를 함께 반영할 수 있도록 설계했습니다. 실험은 표준 Hateful Memes Dataset을 기반으로 진행했으며, 단일 모달 모델과 단순 결합 방식 등 다양한 베이스라인과 성능을 비교했습니다.

Self-Attention 기반 이미지-텍스트 통합 멀티모달 탐지 파이프라인

연구 결과

제안한 통합 모델은 이미지 전용, 텍스트 전용 모델은 물론 단순 결합(Concatenation) 방식과 비교했을 때, 유해 밈 탐지 성능에서 일관된 향상을 보였습니다. 특히 AUROC와 Accuracy 지표에서 의미 있는 개선을 확인했고, 멀티모달 정보의 상호작용을 정교하게 반영하는 구조가 실제 탐지 성능 향상에 효과적임을 검증했습니다. 이러한 성과를 바탕으로 KCC 2025 한국컴퓨터종합학술대회에서 일반부문 우수논문상을 수상했습니다.

활용 가능 방안

본 연구는 SNS 플랫폼의 자동 콘텐츠 모더레이션, 아동·청소년 보호를 위한 유해 콘텐츠 필터링, 온라인 혐오 표현에 대한 조기 탐지 및 대응 시스템 등 다양한 서비스에 적용될 수 있습니다. 나아가 이미지와 텍스트가 결합된 복합 콘텐츠를 다루는 실시간 안전성 검사 환경에서도 활용 가능성이 높아, 실제 플랫폼 운영 측면에서도 충분한 확장성을 갖는 접근이라고 볼 수 있습니다.

학회

KCC 2025

수상

일반부문 우수논문상

발표

2025년 7월

분야

Multi-Modal · Vision

Multi-Modal Self-Attention Vision Transformer NLP Meme Detection

2023.01 Time-Series · IoT KCI 등재

카모플라쥬 치료 시스템의 안정적인 운용을 위해, 배터리 잔존 수명(RUL)을 보다 정교하게 예측하는 시계열 모델을 연구했습니다. Sliding Window 기반 데이터 구성과 LSTM을 결합해 배터리 상태 변화의 장기 패턴을 효과적으로 반영하고자 했으며, 이를 통해 시스템 운용 안정성과 배터리 관리 효율을 함께 높일 수 있는 방법을 제안했습니다.

연구 목적

카모플라쥬 치료 시스템은 피부 치료를 위한 의료 광원 장치로, 안정적인 전력 공급이 장비 운용의 핵심 조건입니다. 배터리 상태를 제때 파악하지 못하면 장비의 성능 저하나 예기치 않은 운용 중단으로 이어질 수 있기 때문에, 배터리 잔존 수명(Remaining Useful Life, RUL)을 보다 정확하게 예측해 교체 시점을 최적화하고 시스템의 신뢰성을 높이는 것이 이 연구의 출발점이었습니다.

연구 내용 및 방법

배터리 충·방전 시계열 데이터에 Sliding Window 알고리즘을 적용해 다양한 길이의 학습 샘플을 구성하고, 이를 통해 학습 데이터의 양과 다양성을 함께 확보했습니다. 이후 LSTM(Long Short-Term Memory) 모델을 활용해 배터리 상태 변화에 내재된 장기 의존성을 학습하도록 설계했으며, 윈도우 크기에 따른 예측 성능 차이를 체계적으로 비교해 최적의 설정을 도출했습니다. 또한 GRU, Vanilla RNN 등 다른 시계열 모델과의 비교 실험을 통해 제안 방식의 효과를 검증했습니다.

LSTM 학습 데이터 80% 구간에서의 SoH 예측 결과

연구 결과

제안한 Sliding Window-LSTM 방법론은 기존 단순 LSTM 및 GRU 기반 접근과 비교했을 때, 배터리 RUL 예측에서 MAE와 RMSE 기준으로 더 우수한 성능을 보였습니다. 특히 Sliding Window를 활용한 데이터 구성 방식이 모델의 일반화 성능을 높이는 데 실질적으로 기여함을 확인했으며, 배터리 상태 예측의 안정성과 정확도를 함께 개선할 수 있음을 실험적으로 입증했습니다. 본 연구는 한국정보기술학회논문지(KIIT)에 게재되어 KCI에 등재되었습니다.

활용 가능 방안

이 연구는 의료 장비의 배터리 수명 예측과 교체 최적화는 물론, IoT 기반 웨어러블 디바이스, 전기차(EV), 산업용 로봇 및 드론과 같은 다양한 배터리 기반 시스템에도 적용될 수 있습니다. 나아가 예지보전(Predictive Maintenance) 관점에서 장비 운영 효율을 높이고 유지보수 비용을 줄이는 실용적인 접근으로 확장 가능성이 높습니다.

학회/저널

KIIT 2023

등재

KCI 등재

발표

2023년 1월

분야

Time-Series · IoT

LSTM Sliding Window Time-Series IoT Battery RUL

2022.12 Multi-Modal · Vision 학부생부문 장려상

스마트팜 환경에서 발생하는 식물 피해는 초기 단계일수록 시각적 변화가 미세해, 이미지 정보만으로는 정확한 판단이 어려운 경우가 많습니다. 이에 식물 이미지와 온·습도·조도 등 환경 센서 시계열 데이터를 함께 활용하는 CNN-Transformer 기반 멀티모달 진단 구조를 설계했고, 단일 모달 접근보다 더 정교한 미세 피해 탐지가 가능함을 확인했습니다. 본 연구는 KSC 2022 학부생부문 장려상을 수상했습니다.

연구 목적

이 연구는 스마트팜 환경에서 병해충이나 생육 이상으로 인한 식물 피해를 보다 이른 시점에 정밀하게 탐지하기 위해 시작되었습니다. 초기 피해는 육안으로 구분하기 어렵고, 단일 이미지 분석만으로는 환경적 맥락까지 반영하기 어렵기 때문에, 시각 정보와 환경 센서 데이터를 함께 해석하는 멀티모달 진단 시스템을 통해 작물 손실을 줄이고 보다 선제적인 대응이 가능하도록 하는 것을 목표로 했습니다.

연구 내용 및 방법

식물 이미지는 CNN(Convolutional Neural Network)을 활용해 외형과 질감 등 공간적 특징을 추출하고, 온도·습도·조도와 같은 환경 센서의 시계열 데이터는 Transformer의 Self-Attention 구조로 분석해 시간적 패턴을 반영했습니다. 이후 두 모달의 정보를 결합하는 CNN-Transformer 하이브리드 아키텍처를 설계해, 시각적으로는 유사하지만 환경 조건에 따라 다르게 나타나는 피해 양상까지 함께 구분할 수 있도록 했습니다. 실험은 병해충 피해 이미지와 동기화된 환경 데이터셋을 기반으로 수행했으며, 단일 모달 모델과의 비교를 통해 성능을 검증했습니다.

CNN 기반 이미지 특징 추출과 Transformer 기반 센서 시계열 분석을 결합한 멀티모달 진단 구조

연구 결과

제안한 CNN-Transformer 하이브리드 모델은 단일 이미지 기반 CNN 모델과 비교했을 때 식물 피해 미세 진단 정확도에서 더 우수한 성능을 보였습니다. 특히 환경 센서 데이터를 함께 활용함으로써, 시각적으로 비슷해 보이는 피해 유형 사이의 구분 능력이 향상됨을 확인했습니다. 이를 통해 멀티모달 정보의 결합이 초기 피해 탐지의 정밀도를 높이는 데 효과적임을 실험적으로 입증했고, 그 결과 KSC 2022 한국소프트웨어종합학술대회 학부생부문 장려상을 수상했습니다.

활용 가능 방안

본 연구는 스마트팜 자동화 관리 시스템, 농업용 IoT 기반 작물 건강 모니터링, 온실 및 식물원 통합 관리 솔루션 등으로 확장될 수 있습니다. 또한 정밀 농업(Precision Agriculture) 환경에서 병해충 조기 경보 시스템으로 활용할 수 있으며, 드론 기반 영상 수집 기술과 결합할 경우 더 넓은 재배 구역에 대한 광역 모니터링에도 적용 가능합니다.

학회

KSC 2022

수상

학부생부문 장려상

발표

2022년 12월

분야

Multi-Modal · Vision

CNN Transformer Multi-Modal Time-Series Smart Farm

2022.12 Healthcare · ML

의료 데이터는 변수 수가 많을수록 항상 좋은 성능으로 이어지지 않으며, 오히려 중복되거나 불필요한 특징이 모델의 효율을 떨어뜨릴 수 있습니다. 이에 태아 심음도 데이터를 대상으로 상관관계 기반 특징 선택 기법을 적용해 핵심 변수만 남기는 예측 모델을 설계했고, 정확도를 유지하면서도 모델 복잡도와 학습 부담을 줄일 수 있음을 확인했습니다. 본 연구는 KSC 2022에서 발표되었습니다.

연구 목적

이 연구는 태아 심음도(CTG, Cardiotocography) 데이터를 활용한 태아 건강 예측에서, 다수의 입력 변수 가운데 실제 예측에 의미 있게 기여하는 핵심 특징만을 효과적으로 선별하는 방법을 찾기 위해 시작되었습니다. 의료 데이터에서는 변수 수가 많아질수록 모델이 복잡해지고 해석성과 효율이 떨어질 수 있기 때문에, 예측 정확도를 최대한 유지하면서도 진단 시간과 계산 비용을 함께 줄일 수 있는 특징 선택 방법론을 제안하는 것이 목표였습니다.

연구 내용 및 방법

태아 건강 데이터셋(Fetal Health Dataset)의 변수들 사이 상관관계를 피어슨 상관계수(Pearson Correlation) 기반으로 분석한 뒤, 예측 기여도가 낮거나 서로 중복된 정보를 담고 있는 특징들을 임계값 기준으로 제거했습니다. 이렇게 정제한 특징 집합과 원본 특징 집합을 각각 사용해 Random Forest, XGBoost 등 다양한 분류 모델을 학습시키고, 차원 축소 전후의 성능 차이를 비교함으로써 제안한 방법의 효과를 체계적으로 검증했습니다.

Point-Biserial Correlation 기반 특징 선택과 표준화·SMOTE를 포함한 데이터 전처리 파이프라인

연구 결과

상관관계 기반 특징 선택을 적용한 결과, 모델 입력 차원은 유의미하게 감소했음에도 전체 특징을 모두 사용할 때와 유사하거나 일부 경우 더 나은 분류 정확도를 보였습니다. 또한 학습 시간 단축과 모델 경량화 효과를 함께 확인할 수 있었으며, 이를 통해 제한된 연산 자원 환경에서도 실용적인 의료 예측 모델을 구현할 수 있음을 실험적으로 입증했습니다. 본 연구는 KSC 2022 한국소프트웨어종합학술대회에서 발표되었습니다.

활용 가능 방안

본 연구는 임상 현장의 실시간 환자 상태 모니터링 시스템, 의료 빅데이터 분석을 위한 효율적인 전처리 파이프라인, 웨어러블 의료기기 기반 원격 건강 모니터링 서비스, 병원 EMR 데이터를 활용한 질병 예측 보조 시스템 등으로 확장될 수 있습니다. 특히 입력 변수 최적화가 중요한 의료 AI 환경에서, 정확도와 효율을 함께 고려한 실용적인 접근으로 활용 가능성이 높습니다.

학회

KSC 2022

발표

2022년 12월

분야

Healthcare · ML

핵심 기법

Feature Selection

Feature Selection Correlation Analysis ML Healthcare Classification

인재풀 등록

팀 프로젝트

Hecto 그룹이 운영한 채용 연계 AI 경진대회에서, 팀의 모델 설계와 데이터 전처리 파이프라인 구축을 주도하며 최종 25위/748팀(Top 3.3%)를 기록했습니다. 이를 통해 Hecto 인사팀 채용 풀 등록이라는 실질적인 성과로 이어졌고, 전체 과정에서 약 90% 수준의 기술 구현을 직접 담당했습니다.

핵심 도전 과제

이 대회의 핵심 평가지표는 Log Loss였기 때문에, 모델이 특정 클래스에 과도하게 확신하는 순간 점수가 크게 악화되는 구조였습니다. 여기에 실내·실외, 주간·야간 등 촬영 환경 차이로 인한 도메인 편차가 존재했고, 학습을 방해하는 노이즈 이미지까지 포함되어 있어 단순히 모델을 학습시키는 것만으로는 안정적인 성능을 확보하기 어려웠습니다.

접근 전략

문제를 단순히 모델 성능 경쟁으로 보기보다, 데이터 품질과 예측 안정성을 함께 다루는 방향으로 접근했습니다. 먼저 노이즈 이미지를 정리해 학습 신호를 안정화했고, 다양한 촬영 환경에 대응하기 위해 증강 조합을 체계적으로 탐색했습니다. 이후 여러 백본 모델의 앙상블과 TTA를 결합해 과신뢰 문제를 완화하고 예측을 보다 부드럽게 만드는 전략을 적용했습니다.

Noise 이미지 제거 — 학습을 방해하는 이상 각도 샘플을 사전에 제거해 검증 Log Loss를 개선
Optuna 기반 증강 탐색 — 다양한 환경 변화에 대응하기 위해 상위 K개 증강 파이프라인을 선별해 혼합 적용
2단계 실험 전략 — 클래스당 약 20개 샘플의 소규모 서브셋으로 빠르게 탐색한 뒤, 유망 조합만 전체 데이터로 확장
5개 모델 앙상블 + TTA — ConvNextV2, EffNetV2, MaxVit, Regnety, SeResNext를 조합해 예측 안정성 향상
소프트 앙상블 가중치 — 검증 Log Loss 기반 가중치를 부드럽게 반영해 특정 모델 편중을 방지

성과

그 결과 748팀 중 최종 25위(Top 3.3%)를 기록했고, Hecto 인사팀 채용 풀에 직접 등록되는 성과를 얻었습니다. 단순히 순위만 높인 것이 아니라, 데이터 정제부터 실험 설계, 모델 조합, 추론 안정화까지 전 과정을 주도적으로 설계했다는 점에서 실제 문제 해결 역량을 입증한 프로젝트였습니다. 팀 내 기술 기여도는 약 90%였습니다.

주최

Hecto

결과

HR 채용 풀 등록

기간

2025.05.19 — 2025.06.16

기여도

90% (팀)

Computer Vision Ensemble TTA Optuna ConvNextV2 채용 연계

전체 2등

개인 참가

전기차 관련 정형 데이터를 활용한 가격 예측 문제에서, 복잡한 딥러닝이나 대규모 앙상블 없이도 단순한 모델과 전처리만으로 얼마나 경쟁력 있는 성능을 만들 수 있는지를 검증했습니다. 최소한의 구성으로도 높은 재현성과 안정성을 확보하는 데 집중했고, 그 결과 Private LB 3위, 최종 2위를 기록했습니다.

문제 정의 및 목표

이 과제는 전기차 관련 정형 데이터를 바탕으로 차량 판매 가격을 예측하는 회귀 문제였습니다. 단순히 성능만 높이는 것이 아니라, 복잡한 딥러닝 구조나 무거운 앙상블 없이도 충분히 강력한 결과를 만들 수 있는지 직접 검증해보는 데 의미를 두었습니다. 다시 말해, 과도한 복잡성보다 견고한 베이스라인의 힘을 증명하는 것이 핵심 목표였습니다.

접근 방법

여러 복잡한 전처리와 모델 조합을 시도하기보다, 실제로 점수에 기여하는 단순한 구성을 끝까지 밀어붙이는 전략을 선택했습니다. 불필요한 실험 가지를 줄이고, 검증 가능한 설정을 빠르게 반복하면서 성능을 확인하는 방식으로 접근했습니다.

전처리 — 기본 결측치 처리와 MinMaxScaler만 적용해 입력 데이터를 정리
모델 선택 — 데이터 규모와 구조를 고려해 DecisionTreeRegressor를 선택
하이퍼파라미터 탐색 — Optuna 대신 `max_depth`, `min_samples_split` 등을 직접 순회하며 리더보드 기반으로 성능 검증

성과

DecisionTreeRegressor와 MinMaxScaler라는 비교적 단순한 조합만으로도 Private LB 3위, 최종 2위(점수 1.18159)를 달성했습니다. 복잡한 앙상블 없이 단일 모델 기반 접근으로 상위권 성과를 만들었다는 점에서, 좋은 베이스라인 설계와 빠른 실험 판단의 중요성을 분명하게 보여준 프로젝트였습니다. 데이터 전처리부터 실험 설계, 제출 전략까지 전 과정을 단독으로 수행했습니다.

주최

DACON

결과

전체 2등 수상

기간

2024.12.02 — 2025.01.31

기여도

100% (개인)

Regression DecisionTree MinMaxScaler Hyperparameter Tuning DACON

학생팀 기준 입상권

팀 프로젝트

건설기계 오일 센서 데이터를 바탕으로 정상·이상 상태를 분류하는 문제에서, 일반적으로 딥러닝에 주로 쓰이는 Knowledge Distillation을 머신러닝 방식에 맞게 변형 적용했습니다. 특히 학습 데이터와 예측 데이터 사이의 피처 수가 크게 다른 제약을 해결하는 데 집중했고, 그 결과 517팀 중 21위(Top 4.1%)로 학생 팀 기준 입상권에 진입했습니다.

핵심 제약 조건

이 대회는 단순한 분류 문제처럼 보였지만, 실제로는 해결해야 할 제약이 분명한 과제였습니다. 무엇보다 Knowledge Distillation을 반드시 활용해야 한다는 조건이 있었고, 더 큰 문제는 학습 데이터와 예측 데이터의 피처 구성이 크게 달랐다는 점이었습니다. 즉, 일반적인 방식으로는 학습한 모델을 그대로 테스트 환경에 적용하기 어려운 구조였습니다.

필수 기법 — Knowledge Distillation을 반드시 사용해야 했지만, 원래는 딥러닝 모델 중심으로 활용되는 방식이었음
피처 불일치 — 학습 데이터는 54개 피처, 예측 데이터는 19개 피처로 구성되어 직접적인 적용이 어려웠음

접근 방법

이 문제는 기존 기법을 그대로 적용하기보다, 제약 조건에 맞게 구조를 다시 설계하는 방식으로 접근했습니다. 전체 피처를 활용해 학습한 Teacher Model의 지식을 축약된 피처만 가진 Student Model에 전달하도록 구성했고, 이를 통해 피처 불일치 문제를 우회하면서도 분류 성능을 최대한 유지하고자 했습니다.

Teacher Model — 54개 전체 피처를 사용해 학습 데이터를 분류하고, 각 샘플의 클래스별 확률값을 저장
Temperature Softening — Knowledge Distillation의 temperature 개념을 적용해 확률 분포를 부드럽게 변환한 뒤 저장
Student Model — 테스트 환경과 동일한 19개 피처만 사용해, Teacher의 소프트 타깃을 학습 대상으로 활용
최종 분류 처리 — Student Model의 예측값에 임계값을 적용해 정상·이상 오일 상태를 최종 판별

성과

그 결과 517팀 중 21위(Top 4.1%)를 기록하며 학생팀 기준 입상권에 진입했습니다. 단순히 성적만 낸 것이 아니라, 딥러닝 중심 기법으로 알려진 Knowledge Distillation을 머신러닝 기반 문제에 맞게 변형해 적용하고, 피처 불일치라는 구조적 제약을 해결했다는 점에서 의미가 컸습니다. 팀 내 모델링 기여도는 약 90%였습니다.

주최

AWS · 현대인프라코어

결과

학생팀 기준 입상권 진입

기간

2022.11.07 — 2022.12.12

기여도

90% (팀)

Knowledge Distillation Teacher-Student Classification Sensor Data AWS

About Me

Experience

개인 프로젝트 · Personal SaaS Project

학부연구생 · Undergraduate Researcher

학부연구생 · Undergraduate Researcher

학생연구원 · Student Researcher

학부연구생 · Undergraduate Researcher

컴퓨터공학부

Research & Papers

SixSecond — AI 기반 이력서 분석 및 채용공고 매칭 서비스

의료 AI를 위한 능력 인식 적응형 LLM 라우팅 시스템

GDAO: 그래프 기반 Multi-Agent 개발자 커리어 지원 에이전트

멀티모달 유해 밈 탐지를 위한 Self-Attention 기반 이미지-텍스트 통합 모델

카모플라쥬 치료 시스템을 위한 Sliding Window-LSTM 모델 기반 배터리 잔존 수명 예측

멀티모달 데이터 기반 식물 피해 미세 진단

상관관계 기반 특징 개선 기법을 활용한 환자 건강 예측 모델

Competitions

HAI(하이)! - Hecto AI Challenge : 2025 상반기 헥토 채용 AI 경진대회

전기차 가격 예측 해커톤: 데이터로 EV를 읽다!

건설기계 오일 상태 분류 AI 경진대회

Tech Stack

🧠 AI / ML / DL

🔍 Research Area

💻 Languages

⚙️ Tools & Infra

Get In Touch