Skip to content
View lightleaping's full-sized avatar

Block or report lightleaping

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
lightleaping/README.md

김수진 | AI / RAG / Agent Portfolio

인공지능소프트웨어를 전공하며 Python 기반 데이터 처리, RAG 검색 구조, AI Agent workflow, FastAPI API, Streamlit UI, PyTorch 모델 서빙 프로젝트를 진행했습니다.

최근에는 취업 포트폴리오용 프로젝트를 중심으로, 사용자 입력을 단순히 답변으로 연결하는 것이 아니라 입력 처리 → 의도 분류 → 근거 검색 → 검증 → API/UI 출력까지 이어지는 구조를 구현하고 있습니다.


Tech Stack

AI / RAG / Agent

  • RAG
  • Intent Classification
  • Evidence Retrieval
  • Grounded Answer
  • Self-check Validation
  • Source-aware Reranking
  • BM25 Retrieval
  • Dense Retrieval
  • FAISS
  • SentenceTransformer
  • LangGraph / MCP 구조 학습

Backend / Serving

  • Python
  • FastAPI
  • Streamlit
  • REST API
  • JSON Response
  • SQLite
  • Docker
  • pytest
  • GitHub Actions

AI / ML

  • PyTorch
  • AutoEncoder
  • Anomaly Detection
  • Reconstruction Error
  • Threshold-based Classification
  • Precision / Recall / F1-score
  • scikit-learn
  • pandas / NumPy

Featured Projects

1. Multimodal Intent QA Agent

텍스트와 이미지 입력을 공통 document 구조로 변환하고, 질문 intent를 분류한 뒤 관련 evidence를 검색해 Grounded Answer와 Self-check validation을 제공하는 QA Agent 프로젝트입니다.

  • 텍스트 / 이미지 입력 처리
  • OCR 결과 또는 최종 이미지 텍스트 기반 image document 생성
  • Intent classification
  • SentenceTransformer embedding
  • FAISS retrieval
  • Source-aware reranking
  • Grounded Answer
  • Self-check validation
  • Cost Estimate
  • Streamlit UI
  • FastAPI /agent/query

Repository: https://github.com/lightleaping/multimodal-intent-qa-agent


2. Manufacturing MCP Agent

제조 데이터 질문을 intent로 분류하고, 필요한 MCP-style Tool을 선택해 생산·품질·설비 센서 데이터를 분석한 뒤 answer와 evidence를 반환하는 AI Agent 백엔드 프로젝트입니다.

  • 제조 샘플 데이터 생성
  • SQLite 기반 데이터 저장
  • CSV-to-DB pipeline
  • Intent routing
  • MCP-style Tool function 분리
  • LangGraph workflow 구조
  • FastAPI /agent/query
  • PyTorch SensorAutoEncoder 기반 /model/sensor-anomaly
  • Docker 실행 환경
  • pytest 테스트
  • GitHub Actions CI

Repository: https://github.com/lightleaping/manufacturing-mcp-agent


3. Sensor Anomaly Model Pipeline

센서 데이터를 생성하고 전처리한 뒤, 정상 데이터 기반 PyTorch AutoEncoder를 학습해 reconstruction error로 이상 여부를 판단하는 AI 모델 개발 파이프라인입니다.

  • 센서 데이터 생성
  • 결측치 처리
  • StandardScaler 정규화
  • Train / Validation / Test split
  • PyTorch AutoEncoder 학습
  • Validation error 기반 threshold 설정
  • Precision / Recall / F1-score 평가
  • Confusion Matrix 저장
  • CLI prediction
  • FastAPI inference API

Repository: https://github.com/lightleaping/sensor-anomaly-model-pipeline


4. Local Document Organizer Agent

로컬 문서를 업로드하면 텍스트 품질 검사, 로컬 임베딩 기반 문서 유형 분류, 키워드 추출, 요약, 추천 파일명 생성, 중복 후보 탐지, Markdown 리포트 생성을 수행하는 문서 자동화 Agent입니다.

  • PDF / TXT / Markdown 문서 처리
  • 텍스트 품질 검사
  • 깨진 PDF 감지
  • 로컬 SentenceTransformer 기반 문서 유형 분류
  • README 프로젝트명 감지
  • 키워드 추출
  • 추천 파일명 생성
  • 중복 후보 탐지
  • Markdown 리포트 생성
  • 선택적 Ollama 로컬 LLM 요약 모드

Repository: https://github.com/lightleaping/local-document-organizer-agent


5. Course Study RAG Tutor

수업자료 기반 RAG 학습 도우미입니다. Markdown/TXT 수업자료를 chunk 단위로 나누고, 사용자의 질문과 관련된 근거를 검색한 뒤 file_name, chunk_id, score와 함께 답변을 제공합니다.

  • Keyword Retrieval
  • Embedding Retrieval
  • Hybrid Retrieval
  • Chunk-based evidence
  • Grounded Answer
  • Streamlit UI
  • 검색 방식 비교
  • sample result 문서화

Repository: https://github.com/lightleaping/course-study-rag-tutor


6. Fair Decision RAG

공정거래위원회 공개 의결서 데이터를 대상으로 질문 유형 분류, BM25 검색, Dense Retrieval, Section Boost를 적용해 중복 없는 기존 chunk_id Top-5를 반환하는 로컬 RAG 검색 모듈입니다.

  • 공정거래 의결서 질문 유형 분류
  • BM25 Retrieval
  • Dense Retrieval
  • Section Boost
  • Top-k Selector
  • 중복 없는 Top-5 chunk_id 반환
  • 기존 chunk_id 유지
  • 결과 JSON 저장
  • 검증 리포트 생성

Repository: https://github.com/lightleaping/fair-decision-rag


Additional Projects

BizTalk AI

생성형 AI를 활용한 비즈니스 영어 학습 앱 프로젝트입니다. OpenAI API를 활용해 영어 학습 시나리오와 AI 캐릭터 대화를 생성하고, Azure Speech SDK 기반 STT/TTS 기능을 적용했습니다.

  • OpenAI API 활용
  • 영어 학습 시나리오 생성
  • AI 캐릭터 대화
  • Azure Speech SDK
  • STT / TTS
  • 사용자 입력 기반 서비스 흐름

Movie Review Sentiment Analysis

영화 리뷰 데이터를 수집하고 전처리한 뒤, 긍정·중립·부정 감정 분류와 주요 키워드 시각화를 수행한 데이터 분석 프로젝트입니다.

  • 텍스트 데이터 수집
  • 데이터 전처리
  • 감정 분류
  • 키워드 시각화
  • 결과 해석

Portfolio Direction

저는 다음 방향의 직무를 목표로 준비하고 있습니다.

  • AI Agent Engineer
  • RAG / LLM Application Developer
  • AI Backend Developer
  • AI Model Developer
  • Data / AI Service Developer

프로젝트를 진행할 때는 단순히 모델이나 API를 호출하는 데서 끝내지 않고, 입력 데이터 구조, 검색 품질, 근거 trace, 검증 기준, API 응답 형식, 실행 문서화까지 함께 설계하려고 합니다.


Contact

Popular repositories Loading

  1. s23.aiweb2026.site s23.aiweb2026.site Public

    CSS

  2. fair-decision-rag fair-decision-rag Public

    공정거래 공개 의결서 질의에 대해 BM25/Dense Retrieval, section boost, 중복 없는 Top-5 chunk_id 반환을 수행하는 로컬 RAG 검색 모듈

  3. lightleaping lightleaping Public

  4. course-study-rag-tutor course-study-rag-tutor Public

    Course study RAG tutor with keyword, embedding, and hybrid retrieval, grounded answers, chunk_id evidence, and Streamlit UI.

    Python

  5. local-document-organizer-agent local-document-organizer-agent Public

    Local document organizer agent with embedding-based classification, keyword extraction, duplicate detection, and optional local LLM summary.

    Python

  6. manufacturing-mcp-agent manufacturing-mcp-agent Public

    MCP Tool, LangGraph, FastAPI, SQLite, PyTorch 기반 제조 데이터 탐색·진단 AI Agent 백엔드 프로젝트

    Python