Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 검색어 추천
- 카카오
- 백준
- spring event
- 아키텍쳐 개선
- 디버깅
- gRPC
- jwt 표준
- 크롤링
- 이분탐색
- 쿠키
- 셀러리
- ai agent
- 추천 검색 기능
- 구현
- next-stock
- 레디스 동시성
- langgraph
- ipo 매매자동화
- AWS
- 트랜잭샨
- piplining
- 누적합
- JPA
- 프로그래머스
- 몽고 인덱스
- 결제서비스
- docker
- BFS
- 완전탐색
Archives
- Today
- Total
목록2025/01/29 (1)
코딩관계론

1. 문제 정의: 테마 관련 뉴스 판별 필요성주식 시장에는 AI, 2차전지, 신재생에너지, 원전 등 다양한 테마가 존재합니다. 하지만 테마 키워드로 뉴스를 크롤링하면 실제 투자에 유용하지 않은 정보성 없는 뉴스들이 포함되는 문제가 발생합니다.예를 들어, "원자력발전소" 키워드로 크롤링할 경우:원전 설비나 정책이 아닌 단순 지역 축제 소식 등 무가치한 정보가 포함될 수 있습니다.따라서 테마와 관련 있는 뉴스만 정확히 필터링하는 로직이 필수적입니다.초기 시도했던 접근 방법간단한 규칙 기반 필터링사전 정의된 키워드로 뉴스를 걸러냄문제점: 키워드 변형이나 문맥 차이로 중요한 뉴스를 놓치거나 무관한 뉴스가 필터링되지 않는 문제 발생모델 파인튜닝테마 관련 여부 데이터셋으로 모델 튜닝문제점: 높은 튜닝 비용과 유지보..
개발/Hot-Stock
2025. 1. 29. 22:47