Overview
목적
ByCoBERT가 class 단위로 보안 취약점을 예측하도록 훈련시키고 결과 정리
근거
OWASP라는 작은 class-level labeled dataset을 사용했을 때 0.6 정도의 결과를 확인하여 가능성이 있다고 보았음. [KIISE_JOK ByCoBERT]
데이터셋
class 단위 라벨링된 Java project들
- 1안 : 캡스톤2에서 사용한 mvnrepo의 project들 [mvnCrawler/test_300_300]
- 2안 : Java_Juliet_1.3의 class들을 취약한 파일과 안전한 파일로 분리 [BKJ-Juliet]
알고리즘
기존 ByCoBERT에서 project 단위로 분할한 것을 class 단위로 분할하도록 수정 [ByCoBERT/pretrainByteBERT.py]
결과
class 단위로 confusion matrix 표현하기
주요 일정
- 5/1 프로젝트 시작
- 5/7 Proposal 제출
- 6/14 발표(video) 제출
- 총 45일(6주)