SPDX Identifier: BigScience-RAIL-1.0
- 대규모 언어 모델 전용 라이선스
- 모델 사용, 수정, 배포: 자유롭게 허용 (상업적 사용 포함)
- 고지 의무: 라이선스 정보 및 사용 제한 사항 명시
- 용도 제한: 불법적, 차별적, 유해한 목적 사용 금지
- 파생 모델: 동일한 제한 사항 적용 필수
- 생성된 결과물: 사용자 책임 (모델 라이선스와 별개)
BigScience RAIL은 CreativeML Open RAIL-M과 유사하지만 언어 모델에 특화되어 있습니다:
- 텍스트 생성 모델(LLM)에 적용
- 더 구체적인 금지 용도 명시 (특히 차별, 허위 정보)
- 모델 카드(Model Card) 제공 의무
LLM 기반 서비스 개발 시 OSPO에 문의하시기 바랍니다.
BigScience RAIL이란?
BigScience RAIL (Responsible AI License)은 2022년 BigScience 프로젝트가 BLOOM 언어 모델과 함께 공개한 라이선스입니다.
BigScience 프로젝트
- BLOOM: 176B 파라미터 다국어 언어 모델
- 1000명 이상의 연구자 참여
- 책임있는 AI 개발을 핵심 가치로 설정
RAIL의 두 가지 버전
| 버전 | 적용 대상 | 특징 |
|---|---|---|
| RAIL-M | 모델 가중치 | 모델 자체의 사용 제한 |
| RAIL++-M | 모델 + 코드 | 모델과 학습/추론 코드 모두 포함 |
BigScience는 RAIL-M 사용 (모델에만 적용)
주요 사용 프로젝트
BLOOM 계열
- BLOOM: BigScience의 176B 모델
- BLOOMZ: 지시 따르기(instruction-following) 버전
- mT0: 다국어 제로샷 모델
기타 RAIL 채택 모델
- 일부 오픈 LLM 파인튜닝 모델
- 연구용 언어 모델들
허용 사항
자유롭게 할 수 있는 것
모델 사용
- 텍스트 생성
- 번역, 요약, 질의응답
- 챗봇 구축
- 상업적 서비스 제공
모델 수정
- 파인튜닝
- 추가 학습
- LoRA, QLoRA 등 경량화
모델 배포
- 수정된 모델 공개
- 파생 모델 배포
- 상업적 API 서비스
생성물 활용
- AI 생성 텍스트의 상업적 사용
- 2차 저작물 제작
금지 사항 (Restrictions)
BigScience RAIL은 다음 용도로 사용할 수 없습니다:
1. 불법 활동
- 범죄 계획 또는 실행 지원
- 불법 콘텐츠 생성
- 테러 활동 지원
2. 아동 보호
- 아동 성 착취물 생성
- 아동을 대상으로 한 유해 콘텐츠
- 아동 그루밍 지원
3. 차별 및 혐오
- 인종, 민족, 종교에 대한 차별
- 성별, 성적 지향에 대한 차별
- 장애, 연령에 대한 차별
- 혐오 발언 생성
4. 허위 정보 및 조작
- 의도적인 가짜 뉴스 생성
- 딥페이크 텍스트 생성 (신원 도용 목적)
- 선거 조작 목적 콘텐츠
- 사기 목적 콘텐츠
5. 프라이버시 침해
- 개인정보 무단 수집
- 스토킹, 괴롭힘 지원
- 감시 목적 사용
6. 의료 및 법률
- 전문적 의료 진단 대체
- 법률 자문 대체
- 재무 자문 대체
7. 자해 및 폭력
- 자살, 자해 조장
- 폭력 조장
- 무기 제조 정보
8. 고위험 의사결정
- 자동화된 신용 평가 (단독 의사결정)
- 자동화된 채용 결정 (단독 의사결정)
- 형사 사법 결정 (단독 의사결정)
사용 시나리오
허용되는 사용
1. 챗봇 서비스
시나리오: 고객 상담 챗봇
사용 방식: BLOOM 파인튜닝하여 상담 봇 구축
판단: 허용 (상업적 사용 OK, 금지 용도 아님)
2. 번역 서비스
시나리오: 다국어 자동 번역
사용 방식: BLOOM의 다국어 능력 활용
판단: 허용
3. 콘텐츠 생성 도구
시나리오: 마케팅 카피 생성 도구
사용 방식: BLOOM 기반 텍스트 생성
판단: 허용 (차별적/허위 콘텐츠 아닌 경우)
금지되는 사용
1. 가짜 뉴스 생성기
시나리오: 자동 가짜 뉴스 생성 도구
사용 방식: 허위 정보 대량 생성
판단: 금지 (허위 정보 생성)
2. 차별적 콘텐츠 생성
시나리오: 특정 집단을 비하하는 텍스트 생성
사용 방식: 혐오 발언 생성
판단: 금지 (차별 및 혐오)
3. 자동화된 신용 평가
시나리오: LLM으로 신용 점수 자동 결정
사용 방식: 대출 승인/거부 자동 결정
판단: 금지 (고위험 의사결정)
검토 필요
1. 교육용 챗봇
시나리오: 학생 상담 챗봇
사용 방식: 진로 상담, 심리 상담
판단: 의료/심리 자문 경계, 전문가 검토 필요
2. 채용 보조 도구
시나리오: 이력서 스크리닝 보조
사용 방식: 최종 결정은 사람이 하지만 AI가 추천
판단: 사용 방식에 따라 다름, OSPO 검토
모델 카드 의무
BigScience RAIL은 모델 카드(Model Card) 제공을 권장합니다.
모델 카드에 포함할 내용
모델 정보
- 모델 구조, 파라미터 수
- 학습 데이터 출처
- 학습 방법
제한 사항
- 모델의 한계
- 알려진 편향(Bias)
- 부적절한 사용 사례
사용 가이드
- 권장 사용 사례
- 금지 사항
- 윤리적 고려사항
예시: BLOOM Model Card
파생 모델의 라이선스
파생 모델을 배포할 때:
필수 사항
- 동일한 용도 제한 사항 적용
- 라이선스 정보 명시
- 모델 카드 제공 (권장)
라이선스 전파
BLOOM → 파인튜닝 → 커스텀 모델
→ 커스텀 모델도 BigScience RAIL 또는 동등한 제한 적용
AI 생성물의 책임
중요: 생성된 텍스트의 책임
- 모델 제공자: 모델 사용 제한 명시 의무
- 모델 사용자: 생성물의 적법성 확인 의무
- 서비스 제공자: 사용자의 악용 방지 조치 의무