A.X K1 논문 리뷰 — 519B MoE 모델의 아키텍처, 데이터 파이프라인, Think-Fusion 학습 전략
9 min read · 2026
TelAgentBench 논문 리뷰 - 통신 도메인 LLM 에이전트의 5가지 핵심 역량 평가 벤치마크
24 min read · 2026
TelBench 논문 리뷰 — 통신 도메인 특화 LLM 벤치마크의 설계, 구축, 평가
22 min read · 2026
FlashAttention-4 논문 리뷰 — Blackwell GPU의 비대칭 스케일링에 맞춘 파이프라인 재설계와 소프트웨어 지수함수
11 min read · 2026
FlashAttention-3 논문 리뷰 — Hopper GPU의 비동기 실행과 FP8을 활용한 Attention 최적화
19 min read · 2026
Flash Attention 2를 Triton으로 구현한다 — un-scaled 누적, exp2 트릭, Causal 2-stage, tl.dot accumulator, autotune
6 min read · 2026
Flash Attention을 Triton으로 구현한다 — Forward/Backward 전체 구현과 RTX 4080·A100·H100·B200 아키텍처별 최적화 포인트
14 min read · 2026
LoRA vs Full Fine-tuning 논문 리뷰 — Intruder Dimensions과 Spectral 분석을 통한 차이점 분석
10 min read · 2024
Meta-Rewarding 논문 리뷰 — Actor, Judge, Meta-Judge 3역할 자기 개선 학습
8 min read · 2024
FlashAttention-2 논문 리뷰 — non-matmul FLOPs 감소, 병렬화, warp partitioning 개선
12 min read · 2023
EfficientNet 논문 리뷰와 네트워크 경량화 방법론
4 min read · January 03, 2021
2021 · paper lightweight efficientnet · paper
시각장애인을 위한 약학정보 제공 앱 개발기
4 min read · January 03, 2020
2020 · app accessibility project · project
GAN의 기본 개념과 학부생 관점에서의 이해
4 min read · September 15, 2019
2019 · gan deep-learning generative-model · paper