(작성중)2025 SNU NLP Lab Winter Internship

2025 서울대학교 자연어처리 연구실 활동 정리

Introduction

이번 동계 인턴에서는 서울대 자연어처리 랩실의 DAG LLM에 적용할 AI Agent를 구현하는 업무를 맡았다. 인턴은 총 6명으로, 3달 동안 번갈아가면서 발표를 맡았다. Agentic workflow에 대한

Implementation

flowchart LR
    subgraph 1["사용자 쿼리 수신"]
    end

    subgraph 2["Query Preprocessing"]
        2a["불용어, 특수문자 제거"]
        2b["오탈자 제거"]
    end

    subgraph 3["LLM Prompting"]
        subgraph 3a["MindSearch Architecture"]
            3aa["Sub-query로 분리"]
            subgraph Subqueries["생성된 Subqueries"]
                3ab["Subquery 1"]
                3ac["Subquery 2"]
                3ad["Subquery 3"]
                3ae["Subquery k"]
            end
        end
    end

    subgraph 4["LLM 답변 Parsing"]
        4a["답변 분석 및 구조화"]
    end

    subgraph 5["Query Routing"]
        5a["내부 DB 사용 결정"]
        5b["외부 검색 수행 결정"]
    end

    subgraph 6["Search.py"]
        6a["내부 DB 검색 로직"]
        subgraph 6b["외부 검색 로직"]
            7["답변 크롤링"]
            8["Beautify"]
        end
    end

    subgraph 9["LLM Prompting"]
            9a["Sub-query merging"]
            9b["LLM"]
    end


    subgraph 10["최종 출력"]
    end

    %% Connections
    1 --> 2a --> 2b
    2b --> 3aa
    3aa --> Subqueries
    3ab --> 4
    3ac --> 4
    3ad --> 4
    3ae --> 4
    4 -- query --> 5
    5a --> 6a
    5b --> 7 --> 8

    6a --> 9a
    8 --> 9a

    9a --> 9b --> 10

My Contribution

crawler.py

크롤러를 핸들러 형식으로 작성했다.

정규식 필터링을 사용해서

발표

##

TL;DR