Overview

01 May 2024 in Project on ByCoBERT

목적

ByCoBERT가 class 단위로 보안 취약점을 예측하도록 훈련시키고 결과 정리

근거

OWASP라는 작은 class-level labeled dataset을 사용했을 때 0.6 정도의 결과를 확인하여 가능성이 있다고 보았음. [KIISE_JOK ByCoBERT]

데이터셋

class 단위 라벨링된 Java project들

1안 : 캡스톤2에서 사용한 mvnrepo의 project들 [mvnCrawler/test_300_300]
2안 : Java_Juliet_1.3의 class들을 취약한 파일과 안전한 파일로 분리 [BKJ-Juliet]

알고리즘

기존 ByCoBERT에서 project 단위로 분할한 것을 class 단위로 분할하도록 수정 [ByCoBERT/pretrainByteBERT.py]

결과

class 단위로 confusion matrix 표현하기

주요 일정

5/1 프로젝트 시작
5/7 Proposal 제출
6/14 발표(video) 제출
총 45일(6주)