BigScience RAIL 가이드

BigScience RAIL (Responsible AI License)은 BLOOM 등 대규모 언어 모델(LLM)에 사용되는 라이선스로, 모델의 자유로운 사용과 함께 책임있는 AI 개발을 위한 윤리적 제한 사항을 포함합니다.

    SPDX Identifier: BigScience-RAIL-1.0

    BigScience RAIL이란?

    BigScience RAIL (Responsible AI License)은 2022년 BigScience 프로젝트가 BLOOM 언어 모델과 함께 공개한 라이선스입니다.

    BigScience 프로젝트

    • BLOOM: 176B 파라미터 다국어 언어 모델
    • 1000명 이상의 연구자 참여
    • 책임있는 AI 개발을 핵심 가치로 설정

    RAIL의 두 가지 버전

    버전적용 대상특징
    RAIL-M모델 가중치모델 자체의 사용 제한
    RAIL++-M모델 + 코드모델과 학습/추론 코드 모두 포함

    BigScience는 RAIL-M 사용 (모델에만 적용)

    주요 사용 프로젝트

    BLOOM 계열

    • BLOOM: BigScience의 176B 모델
    • BLOOMZ: 지시 따르기(instruction-following) 버전
    • mT0: 다국어 제로샷 모델

    기타 RAIL 채택 모델

    • 일부 오픈 LLM 파인튜닝 모델
    • 연구용 언어 모델들

    허용 사항

    자유롭게 할 수 있는 것

    1. 모델 사용

      • 텍스트 생성
      • 번역, 요약, 질의응답
      • 챗봇 구축
      • 상업적 서비스 제공
    2. 모델 수정

      • 파인튜닝
      • 추가 학습
      • LoRA, QLoRA 등 경량화
    3. 모델 배포

      • 수정된 모델 공개
      • 파생 모델 배포
      • 상업적 API 서비스
    4. 생성물 활용

      • AI 생성 텍스트의 상업적 사용
      • 2차 저작물 제작

    금지 사항 (Restrictions)

    BigScience RAIL은 다음 용도로 사용할 수 없습니다:

    1. 불법 활동

    • 범죄 계획 또는 실행 지원
    • 불법 콘텐츠 생성
    • 테러 활동 지원

    2. 아동 보호

    • 아동 성 착취물 생성
    • 아동을 대상으로 한 유해 콘텐츠
    • 아동 그루밍 지원

    3. 차별 및 혐오

    • 인종, 민족, 종교에 대한 차별
    • 성별, 성적 지향에 대한 차별
    • 장애, 연령에 대한 차별
    • 혐오 발언 생성

    4. 허위 정보 및 조작

    • 의도적인 가짜 뉴스 생성
    • 딥페이크 텍스트 생성 (신원 도용 목적)
    • 선거 조작 목적 콘텐츠
    • 사기 목적 콘텐츠

    5. 프라이버시 침해

    • 개인정보 무단 수집
    • 스토킹, 괴롭힘 지원
    • 감시 목적 사용

    6. 의료 및 법률

    • 전문적 의료 진단 대체
    • 법률 자문 대체
    • 재무 자문 대체

    7. 자해 및 폭력

    • 자살, 자해 조장
    • 폭력 조장
    • 무기 제조 정보

    8. 고위험 의사결정

    • 자동화된 신용 평가 (단독 의사결정)
    • 자동화된 채용 결정 (단독 의사결정)
    • 형사 사법 결정 (단독 의사결정)

    사용 시나리오

    허용되는 사용

    1. 챗봇 서비스

    시나리오: 고객 상담 챗봇
    사용 방식: BLOOM 파인튜닝하여 상담 봇 구축
    판단: 허용 (상업적 사용 OK, 금지 용도 아님)

    2. 번역 서비스

    시나리오: 다국어 자동 번역
    사용 방식: BLOOM의 다국어 능력 활용
    판단: 허용

    3. 콘텐츠 생성 도구

    시나리오: 마케팅 카피 생성 도구
    사용 방식: BLOOM 기반 텍스트 생성
    판단: 허용 (차별적/허위 콘텐츠 아닌 경우)

    금지되는 사용

    1. 가짜 뉴스 생성기

    시나리오: 자동 가짜 뉴스 생성 도구
    사용 방식: 허위 정보 대량 생성
    판단: 금지 (허위 정보 생성)

    2. 차별적 콘텐츠 생성

    시나리오: 특정 집단을 비하하는 텍스트 생성
    사용 방식: 혐오 발언 생성
    판단: 금지 (차별 및 혐오)

    3. 자동화된 신용 평가

    시나리오: LLM으로 신용 점수 자동 결정
    사용 방식: 대출 승인/거부 자동 결정
    판단: 금지 (고위험 의사결정)

    검토 필요

    1. 교육용 챗봇

    시나리오: 학생 상담 챗봇
    사용 방식: 진로 상담, 심리 상담
    판단: 의료/심리 자문 경계, 전문가 검토 필요

    2. 채용 보조 도구

    시나리오: 이력서 스크리닝 보조
    사용 방식: 최종 결정은 사람이 하지만 AI가 추천
    판단: 사용 방식에 따라 다름, OSPO 검토

    모델 카드 의무

    BigScience RAIL은 모델 카드(Model Card) 제공을 권장합니다.

    모델 카드에 포함할 내용

    1. 모델 정보

      • 모델 구조, 파라미터 수
      • 학습 데이터 출처
      • 학습 방법
    2. 제한 사항

      • 모델의 한계
      • 알려진 편향(Bias)
      • 부적절한 사용 사례
    3. 사용 가이드

      • 권장 사용 사례
      • 금지 사항
      • 윤리적 고려사항

    예시: BLOOM Model Card

    파생 모델의 라이선스

    파생 모델을 배포할 때:

    필수 사항

    • 동일한 용도 제한 사항 적용
    • 라이선스 정보 명시
    • 모델 카드 제공 (권장)

    라이선스 전파

    BLOOM → 파인튜닝 → 커스텀 모델
    → 커스텀 모델도 BigScience RAIL 또는 동등한 제한 적용

    AI 생성물의 책임

    중요: 생성된 텍스트의 책임

    • 모델 제공자: 모델 사용 제한 명시 의무
    • 모델 사용자: 생성물의 적법성 확인 의무
    • 서비스 제공자: 사용자의 악용 방지 조치 의무

    참고 자료