Boostcamp AI Tech

부스트캠프 AI Tech 7기. 11주차 회고록

sejongmin 2024. 11. 1. 20:50

 
OCR 프로젝트가 시작되었습니다.


월요일 (51일차, 2024-10-28)

1. 새로 배운 내용
- Data-Cnetric이란, Model-Centric과 달리 모델을 고정하고 데이터 수집, 전처리, 증강 등 데이터 관련된 기술을 적용해서 성능을 향상시키는 것
- OCR(Optical Character Recognition)은 Detector, Recognizer, Serializer, Parser 순서로 진행됨
- Document Layout Analysis는 OCR과 달리 객체검출을 한 뒤 표, 그림 등 더 정확하게 분류함
 
2. 피어세션 내용
- 화요일 피어세션 전까지 강의, 실습, 과제 다 끝내고 프로젝트에 집중하기로 했다.
- 하루를 계획적으로 보내기 위해 데일리 스크럼마다 노션에 일일 계획서 작성하기로 했다.
- 멘토링에서 vision transformer 논문 발표를 했다.
 
3. 회고
- 멘토님의 이야기를 들으면서 취업 시장 조사를 자주 많이 해봐야 하는 것 같다. 지금부터 부단히 미래에 대해 고민하고 생각해놔야 어떤 것을 준비해야하는 잘 알 수 있는 것 같다. 멘토님 덕을 좀 많이 봐야할 것 같다.


 

화요일 (52일차, 2024-10-29)

1. 새로 배운 내용
- IoU는 Ground Truth와 Prediction 영역의 교집합을 합집합으로 나눈 값, Area Recall은 교집합을 GT 영역으로 나눈 값, Area Precision은 교집합을 Pred 영역으로 나눈 값
- one-to-one은 GT와 Pred이 1대1로 매칭, many-to-one은 여러 GT에 하나의 Pred(Merge), one-to-many는 하나의 GT에 여러 Pred(Split)
 
2. 피어세션 내용
- hard negative sampling에 대해 이야기를 나눴다.
- DetEval, IoU, CLEval에 대해 이야기를 나눴다.
 
3. 회고
- 새벽에 이야기를 많이 했다. 팀원중 어색한 사람이야기, 눈치본 이야기 등 여러 이야기를 들으면서 생각이 많아졌다. 나는 우리팀이 굉장히 편하고 친구같은 분위기라고 생각했는데 나만 너무 편했던게 아닐까 생각이 들었다. 그리고 괜히 명량핫도그 내기 해가지고 아침 6시까지 못잤다.


 

수요일 (53일차, 2024-10-30)

1. 새로 배운 내용
- CVAT을 이용하기 위해서 UFO format을 Datumaro 형식으로 교환해서 annotation을 import해서 사용 가능

- EAST의 intersection을 구하는 방법은 [min(상) + min(하)] * [min(좌) + min(우)]
 
2. 피어세션 내용
- 기존에 알려줬던 UFO format이랑 달라서 illegibility를 어떻게 처리할지 논의했다.

- 데이터 관련해서 생성, 합성, 수집 등을 분업했다. 

 
3. 회고
- 어제 새벽까지 못잤는데 뭔지모르게 많이 피곤하지 않다. 각성상태로 하루를 보낸 것 같다. 아마 내일 지옥이 기다릴 것 같아서 두렵다...


 

목요일 (54일차, 2024-10-31)

1. 새로 배운 내용
- annotation 가이드라인을 작성 후 어노테이터의 일관성을 판단하는 지표 IAA (Inter-Annotator Agreement)에는 2명 이상 Cohen's Kappa, 3명 이상 Fleiss' Kappa, 2명 이상 Krippendorff's Alpha, 최근 새로운 IAA는 Komogorov-Smirnov Test static

 
2. 피어세션 내용
- geometric augmentation은 bbox vertices를 계산해야하기 때문에 적용이 힘들어, albumentation에서 bbox가 변화하지 않은 transformer를 이용했다.

- CORD 데이터셋을 추가하고, coco format을 UFO format으로 변환해서 이용했다.

 
3. 회고
- 많이 피곤하지만 오히려 잠은 줄어든 것 같다. 원래 엄청 피곤할 수록 잠을 많이 못자는 것 같다. 나의 개인적인 적정 수면시간은 9시간 30분인데, 뭔가 피곤한데 새벽에 잠에 들지 않는다. 밤을 새는건 역시 위험하고 미래를 위해서도 하지 않는 것이 인생에 도움이 된다.


 

금요일 (55일차, 2024-11-01)

1. 새로 배운 내용
- 합성 데이터 제작에는 TextRecognitionDataGenerator, SynthText, UnrealText 가 있음.

- 합성 데이터 사용할 땐 pretraining 된 모델에 합성 데이터로 pretraining 한 후, target dataset에 대해 fine-tuning을 진행


 
2. 피어세션 내용
- 크롤링에 성공했고, EasyOCR로 auto annotation을 사용할 수 있도록 준비가 완료 되었다.

- 주말에 발표 자료 전체적인 틀을 만들어 보자.

 
3. 회고
- 기존 프로젝트를 진행했을 때보다 더 계획적이고 효율적으로 진행하고 있는 것 같다. 처음 목표와 계획을 잘 세우고 팀원들도 맡은 바를 잘 해주고 있어서 발표까지 무난하게 진행할 수 있을 것 같다. 마지막 프로젝트 잘 마무리 하면 좋을 것 같다. 남은 기간도 화이팅!