본문 바로가기

My Vision, Computer Vision

검색하기
My Vision, Computer Vision
프로필사진 gyuilLim

  • 분류 전체보기 (85)
    • Paper (50)
    • 환경 설정 (10)
    • WorkPlace (6)
    • 공부 (17)
Guestbook
Notice
Recent Posts
Recent Comments
Link
«   2025/10   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Tags
  • res paper
  • grefcoco
  • gsoc 후기
  • clip
  • 엔트로피란
  • gres
  • object detection
  • mobilenetv1
  • vlm
  • clip adapter
  • 논문 요약
  • gsoc 2025
  • 객체 검출
  • 1차 미분 마스크
  • 에지 검출
  • res
  • gsoc
  • 원격 학습 안끊기게
  • Object detection article
  • 딥러닝 엔트로피
  • 이미지 필터링
  • referring expression segmentation
  • grefcoco dataset
  • google summer of code
  • 딥러닝 목적함수
  • gsoc가 뭔가요
  • blip-2
  • 논문 리뷰
  • 기계학습
  • gsoc 지원
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록vit code (1)

My Vision, Computer Vision

[논문 리뷰/요약] An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

An Image is Worth 16x16 Words: Transformers for Image Recognition at ScaleWhile the Transformer architecture has become the de-facto standard for natural language processing tasks, its applications to computer vision remain limited. In vision, attention is either applied in conjunction with convolutional networks, or used to reparxiv.orgAbstractTransformer가 사실상 NLP 분야의 표준이 되었지만 Computer vision에 ..

Paper 2024. 8. 27. 19:38
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바