본문 바로가기

My Vision, Computer Vision

검색하기
My Vision, Computer Vision
프로필사진 gyuilLim

  • 분류 전체보기 (83)
    • Paper (50)
    • 환경 설정 (10)
    • WorkPlace (5)
    • 공부 (17)
Guestbook
반응형
Notice
Recent Posts
Recent Comments
Link
«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
Tags
  • google summer of code
  • 이미지 필터링
  • 딥러닝 엔트로피
  • 지쏙
  • clip adapter
  • 딥러닝 목적함수
  • gres
  • 기계학습
  • 객체 검출
  • res
  • clip
  • gsoc 후기
  • 엔트로피란
  • 원격 학습 안끊기게
  • 논문 리뷰
  • 에지 검출
  • 논문 요약
  • object detection
  • grefcoco dataset
  • blip-2
  • vlm
  • Object detection article
  • gsoc midterm evaluations
  • grefcoco
  • referring expression segmentation
  • google summer of code 후기
  • res paper
  • gsoc 2025
  • mobilenetv1
  • 1차 미분 마스크
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록llava paper 리뷰 (1)

My Vision, Computer Vision

[논문 리뷰/요약] LLaVA : Visual Instruction Tuning

Visual Instruction TuningInstruction tuning large language models (LLMs) using machine-generated instruction-following data has improved zero-shot capabilities on new tasks, but the idea is less explored in the multimodal field. In this paper, we present the first attempt to use larxiv.orgAbstractLanguage-only GPT-4를 사용하여 Language-image instruction-following data를 생성하는 첫번째 시도.LLaVA(Large Languag..

공부 2025. 2. 2. 22:40
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.