본문 바로가기

My Vision, Computer Vision

검색하기
My Vision, Computer Vision
프로필사진 gyuilLim

  • 분류 전체보기 (84)
    • Paper (50)
    • 환경 설정 (10)
    • WorkPlace (5)
    • 공부 (17)
Guestbook
반응형
Notice
Recent Posts
Recent Comments
Link
«   2025/02   »
일 월 화 수 목 금 토
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28
Tags
  • clip adapter
  • gsoc midterm evaluations
  • 딥러닝 엔트로피
  • clip
  • grefcoco
  • 딥러닝 목적함수
  • 2호선 완주
  • 엔트로피란
  • blip-2
  • vlm
  • Object detection article
  • gsoc 후기
  • 1차 미분 마스크
  • gsoc 2025
  • referring expression segmentation
  • 원격 학습 안끊기게
  • 에지 검출
  • 대학원 일상
  • gres
  • grefcoco dataset
  • mobilenetv1
  • 논문 요약
  • 이미지 필터링
  • 논문 리뷰
  • object detection
  • 2호선 따라걷기
  • res paper
  • 객체 검출
  • res
  • 기계학습
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록2025/02/04 (1)

My Vision, Computer Vision

[논문 요약/리뷰] DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement LearningWe introduce our first-generation reasoning models, DeepSeek-R1-Zero and DeepSeek-R1. DeepSeek-R1-Zero, a model trained via large-scale reinforcement learning (RL) without supervised fine-tuning (SFT) as a preliminary step, demonstrates remarkable reasoninarxiv.orgAbstract본 논문에서는 DeepSeek-R1-Zero와 DeepSeek-R1이라는 모델..

Paper 2025. 2. 4. 17:11
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바