BigScience RAIL 가이드
SPDX Identifier: BigScience-RAIL-1.0
- 대규모 언어 모델 전용 라이선스
- 모델 사용, 수정, 배포: 자유롭게 허용 (상업적 사용 포함)
- 고지 의무: 라이선스 정보 및 사용 제한 사항 명시
- 용도 제한: 불법적, 차별적, 유해한 목적 사용 금지
- 파생 모델: 동일한 제한 사항 적용 필수
- 생성된 결과물: 사용자 책임 (모델 라이선스와 별개)
BigScience RAIL은 CreativeML Open RAIL-M과 유사하지만 언어 모델에 특화되어 있습니다:
- 텍스트 생성 모델(LLM)에 적용
- 더 구체적인 금지 용도 명시 (특히 차별, 허위 정보)
- 모델 카드(Model Card) 제공 의무
LLM 기반 서비스 개발 시 OSPO에 문의하시기 바랍니다.
BigScience RAIL이란?
BigScience RAIL (Responsible AI License)은 2022년 BigScience 프로젝트가 BLOOM 언어 모델과 함께 공개한 라이선스입니다.
BigScience 프로젝트
- BLOOM: 176B 파라미터 다국어 언어 모델
- 1000명 이상의 연구자 참여
- 책임있는 AI 개발을 핵심 가치로 설정
RAIL의 두 가지 버전
| 버전 | 적용 대상 | 특징 |
|---|---|---|
| RAIL-M | 모델 가중치 | 모델 자체의 사용 제한 |
| RAIL++-M | 모델 + 코드 | 모델과 학습/추론 코드 모두 포함 |
BigScience는 RAIL-M 사용 (모델에만 적용)
주요 사용 프로젝트
BLOOM 계열
- BLOOM: BigScience의 176B 모델
- BLOOMZ: 지시 따르기(instruction-following) 버전
- mT0: 다국어 제로샷 모델
기타 RAIL 채택 모델
- 일부 오픈 LLM 파인튜닝 모델
- 연구용 언어 모델들
허용 사항
자유롭게 할 수 있는 것
모델 사용
- 텍스트 생성
- 번역, 요약, 질의응답
- 챗봇 구축
- 상업적 서비스 제공
모델 수정
- 파인튜닝
- 추가 학습
- LoRA, QLoRA 등 경량화
모델 배포
- 수정된 모델 공개
- 파생 모델 배포
- 상업적 API 서비스
생성물 활용
- AI 생성 텍스트의 상업적 사용
- 2차 저작물 제작
금지 사항 (Restrictions)
BigScience RAIL은 다음 용도로 사용할 수 없습니다:
1. 불법 활동
- 범죄 계획 또는 실행 지원
- 불법 콘텐츠 생성
- 테러 활동 지원
2. 아동 보호
- 아동 성 착취물 생성
- 아동을 대상으로 한 유해 콘텐츠
- 아동 그루밍 지원
3. 차별 및 혐오
- 인종, 민족, 종교에 대한 차별
- 성별, 성적 지향에 대한 차별
- 장애, 연령에 대한 차별
- 혐오 발언 생성
4. 허위 정보 및 조작
- 의도적인 가짜 뉴스 생성
- 딥페이크 텍스트 생성 (신원 도용 목적)
- 선거 조작 목적 콘텐츠
- 사기 목적 콘텐츠
5. 프라이버시 침해
- 개인정보 무단 수집
- 스토킹, 괴롭힘 지원
- 감시 목적 사용
6. 의료 및 법률
- 전문적 의료 진단 대체
- 법률 자문 대체
- 재무 자문 대체
7. 자해 및 폭력
- 자살, 자해 조장
- 폭력 조장
- 무기 제조 정보
8. 고위험 의사결정
- 자동화된 신용 평가 (단독 의사결정)
- 자동화된 채용 결정 (단독 의사결정)
- 형사 사법 결정 (단독 의사결정)
사용 시나리오
허용되는 사용
1. 챗봇 서비스
시나리오: 고객 상담 챗봇
사용 방식: BLOOM 파인튜닝하여 상담 봇 구축
판단: 허용 (상업적 사용 OK, 금지 용도 아님)
2. 번역 서비스
시나리오: 다국어 자동 번역
사용 방식: BLOOM의 다국어 능력 활용
판단: 허용
3. 콘텐츠 생성 도구
시나리오: 마케팅 카피 생성 도구
사용 방식: BLOOM 기반 텍스트 생성
판단: 허용 (차별적/허위 콘텐츠 아닌 경우)
금지되는 사용
1. 가짜 뉴스 생성기
시나리오: 자동 가짜 뉴스 생성 도구
사용 방식: 허위 정보 대량 생성
판단: 금지 (허위 정보 생성)
2. 차별적 콘텐츠 생성
시나리오: 특정 집단을 비하하는 텍스트 생성
사용 방식: 혐오 발언 생성
판단: 금지 (차별 및 혐오)
3. 자동화된 신용 평가
시나리오: LLM으로 신용 점수 자동 결정
사용 방식: 대출 승인/거부 자동 결정
판단: 금지 (고위험 의사결정)
검토 필요
1. 교육용 챗봇
시나리오: 학생 상담 챗봇
사용 방식: 진로 상담, 심리 상담
판단: 의료/심리 자문 경계, 전문가 검토 필요
2. 채용 보조 도구
시나리오: 이력서 스크리닝 보조
사용 방식: 최종 결정은 사람이 하지만 AI가 추천
판단: 사용 방식에 따라 다름, OSPO 검토
모델 카드 의무
BigScience RAIL은 모델 카드(Model Card) 제공을 권장합니다.
모델 카드에 포함할 내용
모델 정보
- 모델 구조, 파라미터 수
- 학습 데이터 출처
- 학습 방법
제한 사항
- 모델의 한계
- 알려진 편향(Bias)
- 부적절한 사용 사례
사용 가이드
- 권장 사용 사례
- 금지 사항
- 윤리적 고려사항
예시: BLOOM Model Card
파생 모델의 라이선스
파생 모델을 배포할 때:
필수 사항
- 동일한 용도 제한 사항 적용
- 라이선스 정보 명시
- 모델 카드 제공 (권장)
라이선스 전파
BLOOM → 파인튜닝 → 커스텀 모델
→ 커스텀 모델도 BigScience RAIL 또는 동등한 제한 적용
AI 생성물의 책임
중요: 생성된 텍스트의 책임
- 모델 제공자: 모델 사용 제한 명시 의무
- 모델 사용자: 생성물의 적법성 확인 의무
- 서비스 제공자: 사용자의 악용 방지 조치 의무
참고 자료
- BigScience RAIL-1.0 원문
- SPDX License List - BigScience-RAIL-1.0
- BLOOM Model Card
- Responsible AI Licenses Initiative
Feedback
Was this page helpful?
Glad to hear it! Please tell us how we can improve.
Sorry to hear that. Please tell us how we can improve.