일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- vlm
- clip
- gres
- 논문 요약
- 기계학습
- grefcoco dataset
- gsoc midterm evaluations
- res
- blip-2
- mobilenetv1
- 딥러닝 목적함수
- Object detection article
- object detection
- gsoc 2025
- 대학원 일상
- 딥러닝 엔트로피
- res paper
- 논문 리뷰
- referring expression segmentation
- 2호선 따라걷기
- 에지 검출
- 엔트로피란
- grefcoco
- 1차 미분 마스크
- 이미지 필터링
- 객체 검출
- gsoc 후기
- clip adapter
- 원격 학습 안끊기게
- 2호선 완주
- Today
- Total
목록전체 글 (84)
My Vision, Computer Vision

이 글은『크리스토퍼 비숍, 패턴 인식과 머신 러닝, 김형진 옮김, 제이펍(2018년)』에서 공부한 내용을 토대로 작성되었다.정보 이론(Information Theory)정보 이론이란 정보를 수학적으로 정의하고 측정하는 방법을 연구하는 학문이다. 머신 러닝은 데이터 정보를 다루기 때문에 정보 이론의 개념이 중요하다. (실제로 loss 함수에서 엔트로피 개념이 쓰임) 정보량(Information Content)이산 확률 변수 $x$가 있다고 하자. 이 때, 이 $x$가 가지고 있는 정보량이라는게 있다. 정보량은 ‘놀라움의 정도’라고도 하는데, 일어날 가능성이 낮은 사건이 발생했을 때의 정보량이 더 크기(더 놀랍기) 때문이다. 즉 정보량은 $x$가 발생할 확률에 반비례하며 따라서 확률 분포 $p(x)$에 종속..

Youtube 영상 장면 검색(Colab)https://github.com/gyuilLim/youtube-scene-search-with-text GitHub - gyuilLim/youtube-scene-search-with-text: Finding scenes that you want by text automaticallyFinding scenes that you want by text automatically - gyuilLim/youtube-scene-search-with-textgithub.com 장면 검색 비디오 플레이어https://github.com/gyuilLim/Scene-search-video-player GitHub - gyuilLim/Scene-search-video-player: ..

VGA: Vision GUI Assistant -- Minimizing Hallucinations through Image-Centric Fine-TuningRecent advances in Large Vision-Language Models (LVLMs) have significantly improve performance in image comprehension tasks, such as formatted charts and rich-content images. Yet, Graphical User Interface (GUI) pose a greater challenge due to their structuarxiv.orgAbstract기존 VLM은 시각적 입력을 무시하고 텍스트에 과도하게 의존하는 경..

REDQT: a method for automated mobile application GUI testing based on deep reinforcement learning algorithmsAs mobile applications become increasingly prevalent in daily life, the demand for their functionality and reliability continues to grow. Traditional mobile application testing methods, particularly graphical user interface (GUI) testing, face …www.springerprofessional.deAbstract이 논문은 심층 강..

End-to-End Object Detection with TransformersWe present a new method that views object detection as a direct set prediction problem. Our approach streamlines the detection pipeline, effectively removing the need for many hand-designed components like a non-maximum suppression procedure or anchor genearxiv.orgAbstractDETR은 Object detection을 Direct set prediction problem으로 본다.또한 NMS, Anchor genera..
nbconvert란?전 보통 개발 툴로 vscode를 사용하는데, .ipynb에서 간단한 체크를 한 뒤 .py에서 디버깅을 진행합니다. 이전에는 .ipynb에 있는 코드를 셀 마다 하나씩 .py에 복사/붙여넣기해서 옮겨줬는데, nbconvert를 사용하면 터미널 명령어 한 줄로 편하게 변환할 수 있습니다.nbconvert 설치pip install nbconvert 또는apt-get install nbconvert 로 nbconvert를 설치해줍니다.명령어.py를 .ipynb로 변환하기jupyter nbconvert --to script [파일 이름].ipynb .py 여러개를 .ipynb로 변환하기jupyter nbconvert --to script [파일이름1].ipynb [파일이름2].ipynb [파..