BigScience RAIL 가이드

BigScience RAIL (Responsible AI License)은 BLOOM 등 대규모 언어 모델(LLM)에 사용되는 라이선스로, 모델의 자유로운 사용과 함께 책임있는 AI 개발을 위한 윤리적 제한 사항을 포함합니다.

SPDX Identifier: BigScience-RAIL-1.0

BigScience RAIL이란?

BigScience RAIL (Responsible AI License)은 2022년 BigScience 프로젝트가 BLOOM 언어 모델과 함께 공개한 라이선스입니다.

BigScience 프로젝트

  • BLOOM: 176B 파라미터 다국어 언어 모델
  • 1000명 이상의 연구자 참여
  • 책임있는 AI 개발을 핵심 가치로 설정

RAIL의 두 가지 버전

버전적용 대상특징
RAIL-M모델 가중치모델 자체의 사용 제한
RAIL++-M모델 + 코드모델과 학습/추론 코드 모두 포함

BigScience는 RAIL-M 사용 (모델에만 적용)

주요 사용 프로젝트

BLOOM 계열

  • BLOOM: BigScience의 176B 모델
  • BLOOMZ: 지시 따르기(instruction-following) 버전
  • mT0: 다국어 제로샷 모델

기타 RAIL 채택 모델

  • 일부 오픈 LLM 파인튜닝 모델
  • 연구용 언어 모델들

허용 사항

자유롭게 할 수 있는 것

  1. 모델 사용

    • 텍스트 생성
    • 번역, 요약, 질의응답
    • 챗봇 구축
    • 상업적 서비스 제공
  2. 모델 수정

    • 파인튜닝
    • 추가 학습
    • LoRA, QLoRA 등 경량화
  3. 모델 배포

    • 수정된 모델 공개
    • 파생 모델 배포
    • 상업적 API 서비스
  4. 생성물 활용

    • AI 생성 텍스트의 상업적 사용
    • 2차 저작물 제작

금지 사항 (Restrictions)

BigScience RAIL은 다음 용도로 사용할 수 없습니다:

1. 불법 활동

  • 범죄 계획 또는 실행 지원
  • 불법 콘텐츠 생성
  • 테러 활동 지원

2. 아동 보호

  • 아동 성 착취물 생성
  • 아동을 대상으로 한 유해 콘텐츠
  • 아동 그루밍 지원

3. 차별 및 혐오

  • 인종, 민족, 종교에 대한 차별
  • 성별, 성적 지향에 대한 차별
  • 장애, 연령에 대한 차별
  • 혐오 발언 생성

4. 허위 정보 및 조작

  • 의도적인 가짜 뉴스 생성
  • 딥페이크 텍스트 생성 (신원 도용 목적)
  • 선거 조작 목적 콘텐츠
  • 사기 목적 콘텐츠

5. 프라이버시 침해

  • 개인정보 무단 수집
  • 스토킹, 괴롭힘 지원
  • 감시 목적 사용

6. 의료 및 법률

  • 전문적 의료 진단 대체
  • 법률 자문 대체
  • 재무 자문 대체

7. 자해 및 폭력

  • 자살, 자해 조장
  • 폭력 조장
  • 무기 제조 정보

8. 고위험 의사결정

  • 자동화된 신용 평가 (단독 의사결정)
  • 자동화된 채용 결정 (단독 의사결정)
  • 형사 사법 결정 (단독 의사결정)

사용 시나리오

허용되는 사용

1. 챗봇 서비스

시나리오: 고객 상담 챗봇
사용 방식: BLOOM 파인튜닝하여 상담 봇 구축
판단: 허용 (상업적 사용 OK, 금지 용도 아님)

2. 번역 서비스

시나리오: 다국어 자동 번역
사용 방식: BLOOM의 다국어 능력 활용
판단: 허용

3. 콘텐츠 생성 도구

시나리오: 마케팅 카피 생성 도구
사용 방식: BLOOM 기반 텍스트 생성
판단: 허용 (차별적/허위 콘텐츠 아닌 경우)

금지되는 사용

1. 가짜 뉴스 생성기

시나리오: 자동 가짜 뉴스 생성 도구
사용 방식: 허위 정보 대량 생성
판단: 금지 (허위 정보 생성)

2. 차별적 콘텐츠 생성

시나리오: 특정 집단을 비하하는 텍스트 생성
사용 방식: 혐오 발언 생성
판단: 금지 (차별 및 혐오)

3. 자동화된 신용 평가

시나리오: LLM으로 신용 점수 자동 결정
사용 방식: 대출 승인/거부 자동 결정
판단: 금지 (고위험 의사결정)

검토 필요

1. 교육용 챗봇

시나리오: 학생 상담 챗봇
사용 방식: 진로 상담, 심리 상담
판단: 의료/심리 자문 경계, 전문가 검토 필요

2. 채용 보조 도구

시나리오: 이력서 스크리닝 보조
사용 방식: 최종 결정은 사람이 하지만 AI가 추천
판단: 사용 방식에 따라 다름, OSPO 검토

모델 카드 의무

BigScience RAIL은 모델 카드(Model Card) 제공을 권장합니다.

모델 카드에 포함할 내용

  1. 모델 정보

    • 모델 구조, 파라미터 수
    • 학습 데이터 출처
    • 학습 방법
  2. 제한 사항

    • 모델의 한계
    • 알려진 편향(Bias)
    • 부적절한 사용 사례
  3. 사용 가이드

    • 권장 사용 사례
    • 금지 사항
    • 윤리적 고려사항

예시: BLOOM Model Card

파생 모델의 라이선스

파생 모델을 배포할 때:

필수 사항

  • 동일한 용도 제한 사항 적용
  • 라이선스 정보 명시
  • 모델 카드 제공 (권장)

라이선스 전파

BLOOM → 파인튜닝 → 커스텀 모델
→ 커스텀 모델도 BigScience RAIL 또는 동등한 제한 적용

AI 생성물의 책임

중요: 생성된 텍스트의 책임

  • 모델 제공자: 모델 사용 제한 명시 의무
  • 모델 사용자: 생성물의 적법성 확인 의무
  • 서비스 제공자: 사용자의 악용 방지 조치 의무

참고 자료