bge-m3-finetune / README.md
kgmyh's picture
Add new SentenceTransformer model
e12f44d verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:120
  - loss:MultipleNegativesRankingLoss
base_model: BAAI/bge-m3
widget:
  - source_sentence: 미국의 빅테크 기업들이 최근에 어떤 사이버 보안 조치를 강화하고 있나요?
    sentences:
      - >-
        23 Ⅱ. ICT 이슈 Top10
         ⑥미국, 반도체 산업 활성화에 박차
         CHIPS 법안을 통한 연구개발 및 제조 지원 강화
        • 미국 정부는 반도체법 (CHIPS Act)에 따라 반도체 산업을 활성화하기 위해 R&D와 제조 지원에 

        520 달러(약 64 8,400  원)를 책정함 .  조치는 반도체 생산 분야에서 미국의 경쟁력을 

        회복하려는 목적이며 , 자금 배분은 세계 공급량의 40%에서 10%로 급감한 국내 생산 능력을 

        강화하기 위한 전략적 노력임

         반도체 법에 의해 지원되는 여러 이니셔티브  110 달러(약 13 7,100  원)가 R&D에 

        특별히 할당되었으며 , 이는 글로벌 반도체 시장에서 미국의 위치를 강화하고 , 중요 공급망에서 

        기술 주권 확보의 시급성을 해결하려는 목적임
         대규모 반도체 공장 건설을 위한 정부 보조금 배정
         반도체법은 반도체 제조 시설 건설을 위해 390 달러(약 48 6,000  원)의 직접 보조금을 

        배정함 .  자금은 차세대 반도체를 생산할  있는 최첨단 공장 개발을 가속화할 목적이자 , 

        국가 반도체 인프라 재건에 대한 정부의 결단을 보여줌 . 인텔(Intel), 글로벌파운드리스 

        (GlobalFoundries), TSMC  같은 기업들이 잠재적 수혜자로 , 수천 개의 일자리 창출과 미국의 

        제조 능력 강화를 약속하는 프로젝트를 진행 중임

         자금의 신속한 배치를 위해, 미국 상무부는 2024 3 말까지 주요 보조금을 배분할 계획을 

        발표함 . 프로젝트 비용의 최대 15%를 지원하는 보조금은 반도체 산업에 대한 민간 부문의 

        2,300  달러(약 286 2,000  원) 이상의 투자를 촉진할 것으로 기대되며 , 이는 강력한 민관 

        파트너십의 실현을 보여줌
         국가 반도체 기술 센터 설립  연구개발 투자
         국가 반도체 기술 센터(NSTC)  설립은 미국이 반도체 혁신 분야에서 리더십을 유지하려는 

        노력의 중요한 이정표임 . 50 달러(약 6 2,400  원) 이상의 초기 투자로 , NSTC  국가 

        반도체 R&D 노력의 핵심이  것으로 기대됨 .  민관 컨소시엄은 반도체 기술 혁신을 주도하고 , 

        최첨단 반도체 기술의 설계, 프로토타이핑 , 시범 운영을 용이하게 하는 임무를 맡고 있음

         이외에도 CHIPS 법안의 R&D 프로그램은 국가 첨단 포장 제조 프로그램 (National Advanced 

        Packaging Manufacturing Program)  CHIPS 제조 USA 연구소 (CHIPS
        Manufacturing 

        USA Institute)  대한 자금 지원을 포함함 . 이러한 프로그램은 첨단 포장 기술부터 제조 공정의 

        디지털 트윈 기술 개발에 이르기까지 반도체 제조의 핵심 측면을 다루기 위해 설계됨 . 이를 통해, 

        미국 정부는 제조에만 초점을 맞추지 않고 반도체 산업에서 지속적인 리더십을 유지하기 위해 

        필요한 연구  개발을 우선시하는 포괄적인 국가 전략의 기반을 마련하고 있음
      - |-
        8 Ⅰ. ICT 국가 산업 현황
         2.ICT 정부기구
         ③ 국가과학기술위원회 (NSTC) 
         미국 국가과학기술위원회 (NSTC)
        • 국가과학기술위원회 (National Science and Technology Council) 는 1993년 설립되었으며 
        백악관 산하의 자문기구로 역할을 담당하고 있음
        • 국가과학기술위원회의 기능은 ① 과학기술정책 결정과정의 조정 ② 과학기술정책결정 프로그램의 
        목표 지원 ③ 연방정부 전반에 대한 과학기술정책 의제 통합에 기여 ④ 과학기술 분야의 연방 
        정책 및 프로그램 개발 구현 ⑤ 과학기술분야의 국제협력 강화가 포함됨
        • 국가과학기술 위원회는 최근 ‘외국 인재 채용 프로그램 ’과 ‘STEM 교육을 통한 컴퓨팅 능력 
        구축’ 관련 가이드라인을 발간했으며 , ‘연방 사이버보안 연구 및 개발 전략 계획’을 발행함
        [표 4] 미국 국가과학기술위원회 (NSTC)
        구분 내용
        주요 인사아라티 프라바카르
        (Arati Prabhakar)
        백악관 과학기술정책실 (OSTP) 국장
        주요 소식‘외국 인재 채용 프로그램 ’ 지침 발행 ‣ 반도체 및 과학법에 의거해 발행
        ‣ 프로그램에 대한 정의, 금지 사항 등 정리
        ‘연방 사이버보안 
        연구 및 개발 전략 계획’ 발행‣ 사이버보안 관련 연구 자금 지원과 개발 
        우선순위에 대한 업데이트 지침 제공
        ‣ NCS 관련 중요 목표 및 속성 식별
        ‘STEM 교육을 통한 컴퓨팅 능력 구축’ 
        가이드 발행‣ STEM 교육으로 컴퓨터 활용 능력을 
        육성한 모범 사례를 식별·장려
        주요
        산하 조직
        출처 : 국가과학기술위원회
      - |-
        25 Ⅱ. ICT 이슈 Top10 
         ⑧미국, 사이버보안 강화에 박차 
         미국 정부 기관, 해킹 피해 대응 강화
        • 미국의 여러 기업과 정부기관이 MOVEIt 파일 공유 소프트웨어의 취약점을 이용한 사이버 
        공격을 당함. 도난당한 데이터의 민감도에 대한 구체적인 정보는 아직 명확하지 않으나 , 이 
        사건은 최근 몇 년간 발생한 연방기관의 세 번째 주요 침해 사례임
        • 이러한 사건들은 정부기관 내에서 사이버 보안 프로토콜의 긴급한 재평가를 촉발하며 , 정교한 
        사이버 적대자로부터 민감한 정보를 보호하기 위한 강력한 사이버 보안 조치의 필요성을 강조함 . 
        사이버 보안 및 인프라 보안국 (CISA) 은 이러한 해킹의 범위를 적극적으로 조사하며 , 연방기관이 
        받는 영향을 파악하고 적시에 조치를 취할 수 있도록 지원함
         미국, 새로운 국가 사이버 보안 전략 발표
        • 백악관은 2023년 3월, 증가하는 사이버 위협에 대한 국가 방어를 강화하기 위해 새로운 국가 
        사이버 보안 전략을 공개함 . 이 전략은 병원, 에너지 시설 등 핵심 인프라를 보호하고 , 디지털 
        생태계 위협에 대응하기 위해 UN과의 협력을 강화함 . 조 바이든 (Joe Biden) 미국 대통령은 
        일상과 국가 안보를 뒷받침하는 디지털 인프라에 대한 신뢰의 중요성을 강조하며 , 공격보다 
        방어가 용이한 탄력적인 디지털 생태계를 구축하는 전략의 목표를 강조함
        • 이 전략은 사이버 위협 해결을 위한 5개의 핵심을 제시함 . 여기에는 핵심 기반 시설 방어, 위협 
        행위자 교란, 보안 및 회복력을 촉진하기 위한 시장 세력 형성, 회복력 있는 미래에 대한 투자, 
        국제 파트너십 구축이 포함됨 . 책임 소재를 대규모 조직으로 재조정하고 강력한 협업과 보안 
        기술, 인력 개발에 대한 장기 투자로 국가 사이버보안을 강화하려는 행정부의 의지를 내포함
         빅테크 기업, 클라우드 보안 강화 조치
        • 최근 미국 정부 관리들의 이메일이 해킹된 사건에 대응하여 , 아마존 , 구글, 마이크로소프트 등 
        주요 클라우드 서비스 제공업체들은 투명성을 높이고 보안 조치를 강화하라는 압박을 받음.  
        특히 마이크로소프트는 중국 정부와 연계된 스파이 작전으로 인해, 마이크로소프트 네트워크의 
        취약점을 악용하여 민감한 이메일 계정에 접근한 사건으로 인해 정밀 조사를 받음. 이 사건은 
        보안 프로토콜의 재평가와 유사한 침해를 방지하기 위해 보다 엄격한 조치의 도입을 촉발함
        • 이에 미국 사이버 보안 및 인프라 보안국 (CISA) 은 사이버 보안 문제를 해결하기 위한 민관 
        협업의 중요성을 강조하며 , 이 사건을 조사 중임. 더 큰 투명성과 강화된 보안 관행으로의 
        이동은 클라우드 제공업체가 사이버 위협에 대한 방어에서 사이버 보안의 공유 책임 모델로의 
        광범위한 전환을 반영함
  - source_sentence: AI와 관련된 정책 권장 사항을 개발하기 위해 어떤 활동을 시작했나요?
    sentences:
      - |-
        6 Ⅰ. ICT 국가 산업 현황
         2.ICT 정부기구
          ① 국가통신정보관리청 (NTIA)
         국가통신정보관리청 (NTIA)
        • 상무부 산하의 국가통신정보관리청 (National Telecommunications and Information 
        Administration) 은 주로 통신 및 정보 정책 문제에 대하여 대통령에게 자문을 제공할 책임이 
        있는 행정 기관임
        • 국가통신정보관리청은 최근 ‘AI 업무’, ‘Open Weight AI 모델’ 등 AI 관련 정책 권장 사항 
        개발을 위한 대중 참여, 의견 요청 등을 시작함 . 또 무선 공급망 혁신 기금을 통해 차세대 무선 
        기술 지원에 약 8,000 만 달러(약 1,068 억 4,000 만 원)를 지원함
        [표 2] 미국 국가통신정보관리청 (NTIA)
        구분 내용
        주요 인사앨런 데이비슨
        (Alan Davidson)
        사라 모리스
        (Sarah Morris)
        국가통신정보관리청 
        청장/차관보국가통신정보관리청
        부청장 /부차관보 (대행)
        주요 소식‘AI 업무’ 행정명령에 대한 대중 참여 시작‣ AI 모델의 개방성 관련 검토에서 대중 
        참여 시작
        ‣ 안전하고 접근성 높은 AI 정책 모색
        ‘무선 공급망 혁신 기금’ 지원‣ 무선 공급망 혁신 기금 3차 보조금으로 
        약 8,000 만 달러 지원
        ‣ 차세대 무선 기술을 위한 토대 마련 목적
        Open Weight AI 모델에 대한 의견 요청‣ Open Weight AI 모델 관련 위험, 
        이점, 향후 정책에 대한 의견 요청 시작
        ‣ 정책 권장사항 개발 목적
        주요
        산하 조직
        출처 : 미국 국가통신정보관리청
      - |-
        27 Ⅱ. ICT 이슈 Top10
         ⑩미 국방부 , 디지털 트윈 기술 도입 확대
         국방부의 디지털 트윈 기술 활용 현황
        • 디지털 트윈이 전투 수행에서의 변혁적 잠재력을 인정받고 있음. 지멘스 정부 기술 
        (Siemens Government Technologies) 의 존 우스티카 (John Ustica)  사장은 광범위한 데이터 
        입력을 활용하여 결과를 모델링하고 예측하는 기술의 능력을 강조함 . 이러한 인식은 공급망 
        관리 및 전장 능력 향상 등의 작업에서 디지털 트윈의 개발 및 적용을 가속화하기 위한 
        다양한 DOD 조직의 프로젝트로 이어짐
        • 공군은 디지털 트윈 기술 채택에 있어 선두주자로 , 위치타 주립대학교 국립 항공 연구소에 
        1억 달러(약 1,240 억 원) 계약을 수여함으로써 입증됨 . 이 계약은 F-16 파이팅 팔콘(F-16 
        Fighting Falcon)  및 B-1 랜서(B-1 Lancer)  항공기의 디지털 트윈을 생성하는 데 중점을 
        두고 있으며 , DOD가 디지털 트윈을 운영에 통합하려는 의지를 보여줌
         디지털 트윈을 통한 군사 작전 강화 방안
        • 인공지능 /기계학습 도구와 디지털 트윈의 통합은 물리적 무기의 성능을 크게 향상시키는 
        것으로 입증됨 . 공군 연구소 (Air Force Research Laboratory) 의 WeaponONE 포트폴리오 
        실증은 이러한 능력으로 디지털 트윈을 성공적으로 활용함 . 이 접근법은 물리적 생산 전에 
        무기 시스템을 최적화하여 군사 작전의 효과를 높이는 동시에 시간과 자원을 절약함
        • 1970년대 기술인 ALQ-99 전술 방해 시스템 (ALQ-99 Tactical Jamming System) 에 대한 
        해군 항공 시스템 사령부의 디지털 트윈 실험은 기존 군사 자산의 현대화 및 수명 연장 
        가능성을 증명함
         디지털 트윈 기술의 미래 발전 방향
        • 전장 능력과 공급망 탄력성을 업그레이드하기 위한 도구로서 디지털 트윈을 탐색하는 
        국방부의 노력은 디지털 현대화로의 전략적 전환을 나타냄 . 미 국방부는 디지털 트윈이 더 
        많은 데이터를 포함하여 의사 결정 과정의 정확도가 높음에 주목하여 군사 작전을 계획하고 
        실행하는데 중심적인 역할을 할 것으로 기대함
        • 위치타 주립대학교 국립 항공 연구소와 같은 학술 기관과의 협력은 전문 지식과 자원을 
        통해 디지털 트윈 개발이 가속화되는 미래를 예고함 . 이러한 협력은 혁신을 촉진할 뿐만 
        아니라 국방부 운영을 기술적으로 고도화하여 미국의 군사 준비성과 전략적 능력을 더욱 
        강화할 것으로 기대됨
      - >-
        10 Ⅰ. ICT 국가 산업 현황
         3.ICT 주요정책
          ② AI 안전 서약(Summit on AI Safety)
         AI 기업의 안전한 연구개발을 위한 서약 
        • 2023년 7월, 조 바이든 (Joe Biden) 대통령은 AI 기술을 개발하는 주요 기업이 새로운 기술과 

        시스템을 설계・공유・테스트하는 연구개발 과정에 필요한 3가지 원칙과 8가지 세부 조항으로 

        이루어진 ‘AI 안전 서약(Summit on AI Safety)’  발표함

         AI 안전 서약은 ▲안전 ▲보안 ▲신뢰  3가지 원칙을 기반으로 책임감 있는 AI(Responsible 

        AI) 개발을 추진하는 것을 목적으로 

         오픈AI(OpenAI), 구글(Google), 마이크로소프트 (Microsoft), 메타(Meta), 아마존
        (Amazon), 

        앤트로픽 (Anthropic), 인플렉션 AI(InflectionAI)  대형언어모델 (LLM)  보유한 주요 기업 

        7곳이 AI 안전 서약에 동의함

         미국 행정부는 자국에서 AI 안전 서약 의제를 진전시키고 , 동맹국  파트너와 협력하여 AI 

        개발  사용을 관리하기 위한 국제 프레임워크를 구축할 예정임 . 백악관은 보도자료를 통해 

        한국, 호주, 브라질 , 캐나다 , 칠레, 프랑스 , ​​독일, 인도, 유럽연합 (EU)  20개국을 언급함

        [ 6] AI 안전 서약 3가지 원칙

        원칙 세부 조항

        출시  

        제품 안전성 보장‣ 기업은 AI 시스템 출시 전에 내·외부 보안 테스트 약속

         기업은 AI 위험 관리에 관한 정보를 업계 전반, 정부, 시민 사회, 학계와 공유하기 

        위해 최선을 다할  약속

        보안을 최우선으로 

        하는 시스템 구축‣ 회사는 독점·미공개 모델 가중치 보호를 위해 사이버보안  내부 위협 보호 장치에 

        투자하기로 약속

         기업은 AI 시스템의 취약점을 제3자가 쉽게 발견하고 보고할  있도록 전념

        대중의 신뢰 획득‣ 기업은 워터마킹 시스템  콘텐츠의 AI 생성 시기를 사용자가   있도록 강력한 

        기술 메커니즘을 개발하기 위해 노력

         기업은 AI 시스템의 기능, 한계, 적합 또는 부적합한 사용 영역을 공개적으로 

        보고하기로 약속

         기업은 AI 시스템이 야기할  있는 사회적 위험에 대한 연구를 우선시하며 , 악의적 

        편견과 차별을 피하고 개인정보를 보호하기 위한 노력을 약속

         기업은 주요 사회 문제에 대처하기 위한 고급 AI 시스템을 개발·배포하기 위해 전념

        출처 : 미국 백악관
  - source_sentence: 1 달러 클럽 기업에는 어떤 회사들이 포함되나요?
    sentences:
      - |-
        11 Ⅰ. ICT 국가 산업 현황
         3.ICT 주요정책
          ③ 국가 AI R&D 전략 계획
         책임 있는 AI R&D 투자를 위한 국가 전략 
        • 2023년 5월 미국 과학기술정책국 (OSTP) 은 책임 있는 AI R&D 투자를 위한 ‘국가 AI R&D 
        전략 계획(National AI R&D Strategic Plan)’ 업데이트를 발표함
        • 국가 AI R&D 전략 계획은 9대 전략으로 이루어져 있으며 , 그 내용은 이하와 같음
        ① 책임 있는 AI 연구에 대한 장기 투자: AI 분야 글로벌 리더십 확보와 공익에 기여하는 책임 
        있는 혁신을 위해 생성형 AI 등 차세대 AI에 대한 투자를 우선
        ② 인간과 AI의 협업을 위한 효과적인 방법 개발: 인간의 능력을 효과적으로 보완하는 AI 
        시스템을 만드는 방법에 대한 이해 제고
        ③ AI의 윤리적 , 법적, 사회적 영향에 대한 이해 및 대응: AI 시스템이 국가의 가치를 반영하고 
        형평성을 증진할 수 있도록 AI가 초래하는 위험을 이해하고 완화하기 위한 접근법 개발
        ④ AI 시스템의 안전과 보안 확보: 신뢰할 수 있으며 안전한 AI 시스템을 설계하는 방법에 대한 
        지식을 발전
        ⑤ AI 학습 및 테스트를 위한 공유 공개 데이터와 제반 환경 구축: 고품질 데이터 셋과 환경, 
        테스트 및 교육 자원에 대한 접근을 확대
        ⑥ 표준과 벤치마크를 통한 AI 시스템 측정 및 평가: AI 권리장전을 위한 청사진과 AI 위험 
        관리 프레임워크에 따라 기술 표준 및 벤치마크를 포함한 광범위한 AI 평가 기법을 개발
        ⑦ 국가 AI R&D 인력 수요에 대한 이해 제고: AI 인력을 전략적으로 육성하기 위해 R&D 인력 
        개발 기회를 개선
        ⑧ AI 발전 가속화를 위한 공공-민간 파트너십 확대: 학계, 산업계 , 국제 파트너 및 기타 비 
        연방기관과 협력하여 책임 있는 AI R&D에 대한 지속적인 투자와 이를 통한 역량 개발 
        기회를 촉진
        ⑨ AI 연구 분야의 국제 협력에 대한 원칙적이고 조율된 접근 방식 확립: 환경적 지속가능성 , 
        의료, 제조 등과 같은 글로벌 과제를 해결하기 위해 AI R&D에서 국제 협력을 우선시하여 
        국제 가이드라인 및 표준 개발, 이행을 지원
      - |-
        14 Ⅰ. ICT 국가 산업 현황
         5.ICT 주요 기업
         미국 ICT 기업 1위 ‘마이크로소프트 ’
        • 마이크로소프트 (Microsoft) 의 시가총액은 3조 290억 달러(약 4,043 조 7,150 억)로 
        애플(Apple) 을 앞지르고 전 세계 시가총액 1위에 등극함
        • 시가총액을 기준으로 애플(Apple) 과 엔비디아 (NVIDIA) 는 미국 주요 ICT 기업에서 각각 2위, 
        3위를 차지함
         미국 ‘1조 달러 클럽 기업’, 글로벌 시장 주도  
        • 미국 주요 ICT 기업 중 시가총액이 1조 달러(약 1,335 조 원)가 넘는 기업은 6개사임 . ‘1조 달러 
        클럽(The Trillion Dollar Club)’ 기업들은 미국과 글로벌 증시를 주도하고 있음
        [표 9] 미국 주요 ICT 기업 TOP10
        순위 기업명 시가총액 (달러) 사업 분야
        ①Microsoft
        (www.microsoft.com)3.029T검색엔진 , 클라우드 솔루션 등 소프트웨어 
        및 IT 서비스
        ②Apple
        (www.apple.com)2.801T 기술 하드웨어 및 소프트웨어
        ③NVIDIA
        (www.nvidia.com)1.941T 반도체 , 그래픽 프로세서 및 칩셋
        ④Amazon
        (www.amazon.com)1.798T 전자상거래
        ⑤Alphabet
        (www.alphabet.com)1.701T검색엔진 , 클라우드 솔루션 등 소프트웨어 
        및 IT 서비스
        ⑥Meta Platforms
        (meta.com)1.233T소프트웨어 및 IT 서비스 , 인터넷 , 
        메타버스
        ⑦Broadcom
        (www.broadcom.com)597.54B 반도체 , 인프라 소프트웨어
        ⑧Oracle
        (www.oracle.com)306.99B 클라우드 컴퓨팅
        ⑨Salesforce
        (www.salesforce.com)290.17B 클라우드 컴퓨팅
        ⑩AMD
        (www.amd.com)285.25B마이크로프로세서 , 칩셋, 그래픽 칩 및 
        SoC(시스템 온 칩) 솔루션
        출처 : Companies Marketcap
      - |-
        8 Ⅰ. ICT 국가 산업 현황
         2.ICT 정부기구
         ③ 국가과학기술위원회 (NSTC) 
         미국 국가과학기술위원회 (NSTC)
        • 국가과학기술위원회 (National Science and Technology Council) 는 1993년 설립되었으며 
        백악관 산하의 자문기구로 역할을 담당하고 있음
        • 국가과학기술위원회의 기능은 ① 과학기술정책 결정과정의 조정 ② 과학기술정책결정 프로그램의 
        목표 지원 ③ 연방정부 전반에 대한 과학기술정책 의제 통합에 기여 ④ 과학기술 분야의 연방 
        정책 및 프로그램 개발 구현 ⑤ 과학기술분야의 국제협력 강화가 포함됨
        • 국가과학기술 위원회는 최근 ‘외국 인재 채용 프로그램 ’과 ‘STEM 교육을 통한 컴퓨팅 능력 
        구축’ 관련 가이드라인을 발간했으며 , ‘연방 사이버보안 연구 및 개발 전략 계획’을 발행함
        [표 4] 미국 국가과학기술위원회 (NSTC)
        구분 내용
        주요 인사아라티 프라바카르
        (Arati Prabhakar)
        백악관 과학기술정책실 (OSTP) 국장
        주요 소식‘외국 인재 채용 프로그램 ’ 지침 발행 ‣ 반도체 및 과학법에 의거해 발행
        ‣ 프로그램에 대한 정의, 금지 사항 등 정리
        ‘연방 사이버보안 
        연구 및 개발 전략 계획’ 발행‣ 사이버보안 관련 연구 자금 지원과 개발 
        우선순위에 대한 업데이트 지침 제공
        ‣ NCS 관련 중요 목표 및 속성 식별
        ‘STEM 교육을 통한 컴퓨팅 능력 구축’ 
        가이드 발행‣ STEM 교육으로 컴퓨터 활용 능력을 
        육성한 모범 사례를 식별·장려
        주요
        산하 조직
        출처 : 국가과학기술위원회
  - source_sentence: 미국과 일본은 어떤 분야에서 협력을 강화하고 있나요?
    sentences:
      - |-
        · 발행․편집 : 정보통신산업진흥원
        · 발행일자 : 2024.03.08
        해당 원고에 대해 사전 동의 없이 상업 상 또는 다른 목적으로
        무단 전재·변경·제 3자 배포 등을 금합니다 .
        또한 본 원고를 인용하시거나 활용하실 경우
        △출처 표기 △원본 변경 불가 등의 이용 규칙을 지키셔야 합니다 . 
        Copyright 2024 NIPA 정보통신산업진흥원 All Rights Reserved. 
        Printed in Korea
      - |-
        19 Ⅱ. ICT 이슈 Top10
         ②미국, 일본과 양자컴퓨팅 개발 협력
         양국 정상, 양자컴퓨팅 및 첨단 기술 협력 강화에 주력
        • 기시다 후미오 일본 총리와 조 바이든 미국 대통령은 히로시마 회담에서 반도체 , 인공지능 , 특히 
        양자컴퓨팅 분야에서의 협력의 중요성을 강조함 . 이는 베이징의 주장적 행동과 증가하는 미-중 
        기술 경쟁에 대응하기 위한 전략적 노력으로 평가됨 . 두 정상은 인도-태평양 지역의 평화와 
        안정의 기반으로서 한미 동맹의 중요성을 강조하며 공동 가치와 집단 안보의 중요성을 강조함
        • 양국 정상은 또한, 러시아의 침략에 맞서 우크라이나를 지원하고 지역 안보 과제에 대응하기 
        위해 협력하기로 합의함 . 여기에는 북한의 핵 및 탄도미사일 프로그램과 국제법에 반하는 중국의 
        강압적 행동, 중국의 대만 압박에 대한 우려를 반영함 . 이러한 안보 및 기술 협력에 대한 포괄적 
        접근은 미국과 일본의 기술 우위와 지역 안정성을 유지하기 위한 다각적 전략을 강조함
         양자컴퓨팅 연구를 위한 대규모 투자 및 파트너십 발표
        • IBM과 구글(Google) 은 시카고 대학(University of Chicago) 과 도쿄 대학(University of 
        Tokyo) 의 양자컴퓨팅 연구를 위해 1억 5천만 달러(약 1,870 억 원)를 투자할 것이라고 발표함 . 
        이 투자는 중국의 양자컴퓨팅 발전에 앞서기 위한 미국과 일본의 노력을 강화하기 위한 것임. 이 
        파트너십은 약물 분자 상호작용 , 원자 규모 배터리 작동 등 고전 컴퓨터로는 해결할 수 없는 
        복잡한 문제를 해결할 수 있는 핵심 기술의 혁신과 개발을 촉진할 것으로 기대됨
        • 구글과 시카고 대학 및 도쿄 대학 간의 파트너십은 10년간 최대 1억 달러(약 1,240 억 원)를 
        투자하여 고장 내성 양자 컴퓨터 개발을 가속화하기 위해 마련됨 . 이 계획은 연구, 기업가 정신, 
        인력 양성을 지원하며 , 양자컴퓨팅 분야에서 선도적 역할을 하기 위한 미국과 일본 기관 간의 
        협력 노력을 반영함
         양자컴퓨팅 기술 발전을 위한 교육 및 인력 양성 프로그램
        • 이 파트너십은 또한 차세대 양자컴퓨팅 전문가를 양성하기 위한 교육 및 인력 개발에 중점을 둠. 
        미국, 일본 및 기타 지역의 유망한 프로젝트에 자금을 지원함으로써 , 양자 컴퓨팅 분야에서의 
        연구 돌파구를 촉진하고 경력 개발을 지원하는 것을 목표로 함
        • 기업가 정신과 비즈니스 개발은 이 프로그램의 핵심 요소로 , 양자컴퓨팅을 위한 강력한 생태계를 
        구축하는 것을 목표로 함. 대학에서 선발한 시카고 및 도쿄 지역의 스타트업 팀은 구글 스타트업 
        부트캠프 (Google for Startups bootcamp) 에 참여할 예정임 . 이 프로그램은 구글의 글로벌 
        파트너 네트워크에 대한 독점적 프로그래밍 및 접근을 제공하며 , 양자컴퓨팅 분야에서의 혁신과 
        상업화를 촉진하고자 함
      - |-
        6 Ⅰ. ICT 국가 산업 현황
         2.ICT 정부기구
          ① 국가통신정보관리청 (NTIA)
         국가통신정보관리청 (NTIA)
        • 상무부 산하의 국가통신정보관리청 (National Telecommunications and Information 
        Administration) 은 주로 통신 및 정보 정책 문제에 대하여 대통령에게 자문을 제공할 책임이 
        있는 행정 기관임
        • 국가통신정보관리청은 최근 ‘AI 업무’, ‘Open Weight AI 모델’ 등 AI 관련 정책 권장 사항 
        개발을 위한 대중 참여, 의견 요청 등을 시작함 . 또 무선 공급망 혁신 기금을 통해 차세대 무선 
        기술 지원에 약 8,000 만 달러(약 1,068 억 4,000 만 원)를 지원함
        [표 2] 미국 국가통신정보관리청 (NTIA)
        구분 내용
        주요 인사앨런 데이비슨
        (Alan Davidson)
        사라 모리스
        (Sarah Morris)
        국가통신정보관리청 
        청장/차관보국가통신정보관리청
        부청장 /부차관보 (대행)
        주요 소식‘AI 업무’ 행정명령에 대한 대중 참여 시작‣ AI 모델의 개방성 관련 검토에서 대중 
        참여 시작
        ‣ 안전하고 접근성 높은 AI 정책 모색
        ‘무선 공급망 혁신 기금’ 지원‣ 무선 공급망 혁신 기금 3차 보조금으로 
        약 8,000 만 달러 지원
        ‣ 차세대 무선 기술을 위한 토대 마련 목적
        Open Weight AI 모델에 대한 의견 요청‣ Open Weight AI 모델 관련 위험, 
        이점, 향후 정책에 대한 의견 요청 시작
        ‣ 정책 권장사항 개발 목적
        주요
        산하 조직
        출처 : 미국 국가통신정보관리청
  - source_sentence: AI 기술의 안전성과 보안을 확보하는 방법은 무엇인가요?
    sentences:
      - |-
        18 Ⅱ. ICT 이슈 Top10
         ①미국 빅테크 기업, 인공지능 챗봇 개발에 주력
         구글의 제미나이 (Gemini) AI 챗봇 발전 과정
        • 구글의 대화형 AI 챗봇은 처음에 바드(Bard) 로 알려졌으나 , 보다 고도화된 기능이 더해진 
        제미나이 (Gemini) 로 리브랜딩됨 . 이 전환은 구글이 AI 개발에 대한 입지를 다지는 중요한 
        단계로 , 제미나이는 현재까지 구글의 가장 진보된 대형 언어 모델(LLM) 에 의해 구동됨
        • 제미나이는 출시 이후 처음에는 라엠다 (LaMDA) 의 LLM 경량 모델 버전을 사용하다 PaLM 2로 
        전환하고 , 결국 가장 뛰어난 LLM인 제미나이로 업그레이드를 하며 성능과 기능이 크게 향상됨 . 
        이를 통해 제미나이는 구글 렌즈(Google Lens)의 멀티모달 검색과 구글의 이마젠 2(Imagen 
        2)를 활용한 이미지 생성 기능 등을 통합하여 높은 수준의 성능을 발휘할 수 있게 됨
         오픈AI(OpenAI) 의 GPT 시리즈와의 경쟁 구도  
        • 오픈AI의 GPT-4 출시는 AI 산업에서 중요한 이정표를 설정하며 , 미묘한 지시사항을 처리하는 
        것과 같은 AI 모델의 새로운 기준을 제시함 . 이 개발은 오픈AI와 다른 기술 대기업 간의 경쟁을 
        강화하여 대화형 AI가 달성할 수 있는 것과 다양한 분야에의 적용 가능성의 경계를 확장함
        • 훨씬 더 큰 컨텍스트 창을 가진 GPT-4 의 고급 버전인 GPT-4 터보(Turbo) 의 도입은 AI 챗봇 
        산업의 경쟁을 더욱 심화함 . GPT-4 터보는 2023년 4월까지의 지식과 텍스트 -스피치 
        프롬프트와 함께 이미지를 입력으로 받아들일 수 있는 능력을 보여주며 , 오픈AI가 AI 모델의 
        다양성과 적용 가능성을 강화하려는 의지를 드러냄 . 이는 제미나이 AI를 보유한 구글을 포함한 
        다른 회사들이 오픈AI의 혁신에 발맞추기 위해 AI 개발 노력을 가속화 하도록 촉발함
         미국 내 AI 챗봇 기술의 미래 전망 및 영향  
        • 구글의 제미나이와 오픈AI의 GPT 시리즈와 같은 AI 모델의 발전은 여러 산업 전반에 걸쳐 
        혁신을 주도하고 있으며 , 특히 인간과 유사한 반응을 이해하고 생성하는 능력은 고객 서비스 , 
        콘텐츠 생성, 심지어 헬스케어 분야에서 보다 정확하고 효율적인 솔루션을 제공할 것으로 기대됨
        • 이러한 발전은 기술 혁신을 넘어 고용 시장과 경제에까지 영향을 미침. AI 챗봇이 일상에 더욱 
        통합됨에 따라 인간 상호작용에 크게 의존하는 분야에서 직무 변동의 가능성이 있음. 한편 이는 
        AI 개발, 유지보수 및 윤리적 감독 분야에서 새로운 고용 기회를 창출하기도 함. 또한, AI 
        챗봇의 사용은 기업의 상당한 비용 절감을 일으켜 경제 성장에 기여할 수 있음. 정책 입안자들은 
        AI 챗봇 기술의 이점과 사회적 함의의 균형을 맞추는 과제에 직면해 있으며 , AI가 인간의 
        능력을 대체하기보다는 강화하는 미래를 보장해야 할 것임
      - |-
        22 Ⅱ. ICT 이슈 Top10 
         ⑤ 미국, 긍정적인 의료 AI 인식을 바탕으로 연구 활발
         의료진의 AI 기술에 대한 긍정적 인식과 기대
        • 아테나헬스 (Athenahealth) 가 의뢰한 최근 조사에 따르면 , 미국 의사 중 약 83%가 AI가 
        궁극적으로 행정 업무를 간소화하고 진단 정확도를 개선하며 환자 데이터의 패턴을 식별하는 데 
        도움이 될 수 있다고 답함. 이러한 낙관론은 의료 전문가들이 의학에서 기술의 역할을 바라보는 
        방식의 잠재적 전환점으로 여겨지며 , AI가 임상 의사 결정과 행정 업무를 지원하는 보다 통합적인 
        접근으로의 전환을 시사함
        • 아테나헬스의 넬레 제셀(Nele Jessel) 최고 의료 책임자는 기술이 행정 업무를 줄이고 효율성을 
        높여 의사들이 환자 치료에 다시 집중할 수 있도록 해야 한다고 강조함
         AI 도입을 통한 의료 서비스 개선 사례
        • 메이오 클리닉 (Mayo Clinic) 등 여러 병원이 의료 허가 시험의 질문과 답변을 활용하여 더 
        나은 의료 조언을 제공하도록 설계된 구글의 AI 챗봇 ‘Med-PaLM 2’를 시험 운영하기 시작함 . 
        이는 AI를 일상적인 의료 관행에 통합하는 중요한 단계이며 , 의료 조언의 품질을 향상시키고 
        전문가 지식을 보다 접근 가능하고 효율적으로 만들어 의료 산업을 변화시킬 잠재력을 가짐
        • 로스앤젤레스 어린이 병원(Children's Hospital Los Angeles) 은 바이탈 (Vital) 과 협력하여 
        개발한 AI 기반 ER 환자 앱, ERAdvisor 를 도입함 . 이 앱은 소아 응급 방문 중 대기 시간, 
        실험실 결과, 영상 결과 및 퇴원 진행 상황에 대한 실시간 업데이트를 제공하여 환자와 가족의 
        경험을 개선하는 것을 목표로 함
         의료 AI 연구 및 개발에 대한 지속적인 투자와 협력
        • UC 샌디에이고 헬스(UC San Diego Health) 는 환자 포털에서 자동으로 메시지 응답 초안을 
        작성하기 위해 에픽(Epic) 과 마이크로소프트 (Microsoft) 의 생성 AI 기술을 통합하는 파일럿 
        프로그램을 시작함 . 이 프로그램은 ChatGPT 를 발견한 연구를 기반으로 하며, 의사의 문서 
        작업 부담을 줄이는 것을 목표로 하고 의료 제공자가 환자와 상호 작용하는 방식에 상당한 
        영향을 미칠 것으로 기대됨
        • 마이크로소프트와 에픽은 전자건강기록 (EHR) 을 개선하기 위해 생성 AI를 사용하는 파트너십도 
        체결함 . 이는 마이크로소프트 애저 오픈AI 서비스를 에픽의 EHR 플랫폼과 통합하여 자연어 
        쿼리 및 대화형 데이터 분석을 강화하는 것을 목표로 함. 이 파트너십은 의료 분야에서 AI의 
        잠재적 이점, 즉 관리적  부담 감소에서 환자 결과 개선에 이르기까지에 대한 인식이 증가하고 
        있음을 강조함
      - |-
        11 Ⅰ. ICT 국가 산업 현황
         3.ICT 주요정책
          ③ 국가 AI R&D 전략 계획
         책임 있는 AI R&D 투자를 위한 국가 전략 
        • 2023년 5월 미국 과학기술정책국 (OSTP) 은 책임 있는 AI R&D 투자를 위한 ‘국가 AI R&D 
        전략 계획(National AI R&D Strategic Plan)’ 업데이트를 발표함
        • 국가 AI R&D 전략 계획은 9대 전략으로 이루어져 있으며 , 그 내용은 이하와 같음
        ① 책임 있는 AI 연구에 대한 장기 투자: AI 분야 글로벌 리더십 확보와 공익에 기여하는 책임 
        있는 혁신을 위해 생성형 AI 등 차세대 AI에 대한 투자를 우선
        ② 인간과 AI의 협업을 위한 효과적인 방법 개발: 인간의 능력을 효과적으로 보완하는 AI 
        시스템을 만드는 방법에 대한 이해 제고
        ③ AI의 윤리적 , 법적, 사회적 영향에 대한 이해 및 대응: AI 시스템이 국가의 가치를 반영하고 
        형평성을 증진할 수 있도록 AI가 초래하는 위험을 이해하고 완화하기 위한 접근법 개발
        ④ AI 시스템의 안전과 보안 확보: 신뢰할 수 있으며 안전한 AI 시스템을 설계하는 방법에 대한 
        지식을 발전
        ⑤ AI 학습 및 테스트를 위한 공유 공개 데이터와 제반 환경 구축: 고품질 데이터 셋과 환경, 
        테스트 및 교육 자원에 대한 접근을 확대
        ⑥ 표준과 벤치마크를 통한 AI 시스템 측정 및 평가: AI 권리장전을 위한 청사진과 AI 위험 
        관리 프레임워크에 따라 기술 표준 및 벤치마크를 포함한 광범위한 AI 평가 기법을 개발
        ⑦ 국가 AI R&D 인력 수요에 대한 이해 제고: AI 인력을 전략적으로 육성하기 위해 R&D 인력 
        개발 기회를 개선
        ⑧ AI 발전 가속화를 위한 공공-민간 파트너십 확대: 학계, 산업계 , 국제 파트너 및 기타 비 
        연방기관과 협력하여 책임 있는 AI R&D에 대한 지속적인 투자와 이를 통한 역량 개발 
        기회를 촉진
        ⑨ AI 연구 분야의 국제 협력에 대한 원칙적이고 조율된 접근 방식 확립: 환경적 지속가능성 , 
        의료, 제조 등과 같은 글로벌 과제를 해결하기 위해 AI R&D에서 국제 협력을 우선시하여 
        국제 가이드라인 및 표준 개발, 이행을 지원
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
model-index:
  - name: SentenceTransformer based on BAAI/bge-m3
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: Unknown
          type: unknown
        metrics:
          - type: cosine_accuracy@1
            value: 0.88
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 1
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 1
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 1
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.88
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.33333333333333326
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.19999999999999996
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.09999999999999998
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.88
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 1
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 1
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 1
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.9557115704285749
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.94
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.94
            name: Cosine Map@100

SentenceTransformer based on BAAI/bge-m3

This is a sentence-transformers model finetuned from BAAI/bge-m3. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: BAAI/bge-m3
  • Maximum Sequence Length: 8192 tokens
  • Output Dimensionality: 1024 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("kgmyh/bge-m3-finetune")
# Run inference
sentences = [
    'AI 기술의 안전성과 보안을 확보하는 방법은 무엇인가요?',
    '11 Ⅰ. ICT 국가 산업 현황\n 3.ICT 주요정책\n  ③ 국가 AI R&D 전략 계획\n 책임 있는 AI R&D 투자를 위한 국가 전략 \n• 2023년 5월 미국 과학기술정책국 (OSTP) 은 책임 있는 AI R&D 투자를 위한 ‘국가 AI R&D \n전략 계획(National AI R&D Strategic Plan)’ 업데이트를 발표함\n• 국가 AI R&D 전략 계획은 9대 전략으로 이루어져 있으며 , 그 내용은 이하와 같음\n① 책임 있는 AI 연구에 대한 장기 투자: AI 분야 글로벌 리더십 확보와 공익에 기여하는 책임 \n있는 혁신을 위해 생성형 AI 등 차세대 AI에 대한 투자를 우선\n② 인간과 AI의 협업을 위한 효과적인 방법 개발: 인간의 능력을 효과적으로 보완하는 AI \n시스템을 만드는 방법에 대한 이해 제고\n③ AI의 윤리적 , 법적, 사회적 영향에 대한 이해 및 대응: AI 시스템이 국가의 가치를 반영하고 \n형평성을 증진할 수 있도록 AI가 초래하는 위험을 이해하고 완화하기 위한 접근법 개발\n④ AI 시스템의 안전과 보안 확보: 신뢰할 수 있으며 안전한 AI 시스템을 설계하는 방법에 대한 \n지식을 발전\n⑤ AI 학습 및 테스트를 위한 공유 공개 데이터와 제반 환경 구축: 고품질 데이터 셋과 환경, \n테스트 및 교육 자원에 대한 접근을 확대\n⑥ 표준과 벤치마크를 통한 AI 시스템 측정 및 평가: AI 권리장전을 위한 청사진과 AI 위험 \n관리 프레임워크에 따라 기술 표준 및 벤치마크를 포함한 광범위한 AI 평가 기법을 개발\n⑦ 국가 AI R&D 인력 수요에 대한 이해 제고: AI 인력을 전략적으로 육성하기 위해 R&D 인력 \n개발 기회를 개선\n⑧ AI 발전 가속화를 위한 공공-민간 파트너십 확대: 학계, 산업계 , 국제 파트너 및 기타 비 \n연방기관과 협력하여 책임 있는 AI R&D에 대한 지속적인 투자와 이를 통한 역량 개발 \n기회를 촉진\n⑨ AI 연구 분야의 국제 협력에 대한 원칙적이고 조율된 접근 방식 확립: 환경적 지속가능성 , \n의료, 제조 등과 같은 글로벌 과제를 해결하기 위해 AI R&D에서 국제 협력을 우선시하여 \n국제 가이드라인 및 표준 개발, 이행을 지원',
    '18 Ⅱ. ICT 이슈 Top10\n ①미국 빅테크 기업, 인공지능 챗봇 개발에 주력\n 구글의 제미나이 (Gemini) AI 챗봇 발전 과정\n• 구글의 대화형 AI 챗봇은 처음에 바드(Bard) 로 알려졌으나 , 보다 고도화된 기능이 더해진 \n제미나이 (Gemini) 로 리브랜딩됨 . 이 전환은 구글이 AI 개발에 대한 입지를 다지는 중요한 \n단계로 , 제미나이는 현재까지 구글의 가장 진보된 대형 언어 모델(LLM) 에 의해 구동됨\n• 제미나이는 출시 이후 처음에는 라엠다 (LaMDA) 의 LLM 경량 모델 버전을 사용하다 PaLM 2로 \n전환하고 , 결국 가장 뛰어난 LLM인 제미나이로 업그레이드를 하며 성능과 기능이 크게 향상됨 . \n이를 통해 제미나이는 구글 렌즈(Google Lens)의 멀티모달 검색과 구글의 이마젠 2(Imagen \n2)를 활용한 이미지 생성 기능 등을 통합하여 높은 수준의 성능을 발휘할 수 있게 됨\n 오픈AI(OpenAI) 의 GPT 시리즈와의 경쟁 구도  \n• 오픈AI의 GPT-4 출시는 AI 산업에서 중요한 이정표를 설정하며 , 미묘한 지시사항을 처리하는 \n것과 같은 AI 모델의 새로운 기준을 제시함 . 이 개발은 오픈AI와 다른 기술 대기업 간의 경쟁을 \n강화하여 대화형 AI가 달성할 수 있는 것과 다양한 분야에의 적용 가능성의 경계를 확장함\n• 훨씬 더 큰 컨텍스트 창을 가진 GPT-4 의 고급 버전인 GPT-4 터보(Turbo) 의 도입은 AI 챗봇 \n산업의 경쟁을 더욱 심화함 . GPT-4 터보는 2023년 4월까지의 지식과 텍스트 -스피치 \n프롬프트와 함께 이미지를 입력으로 받아들일 수 있는 능력을 보여주며 , 오픈AI가 AI 모델의 \n다양성과 적용 가능성을 강화하려는 의지를 드러냄 . 이는 제미나이 AI를 보유한 구글을 포함한 \n다른 회사들이 오픈AI의 혁신에 발맞추기 위해 AI 개발 노력을 가속화 하도록 촉발함\n 미국 내 AI 챗봇 기술의 미래 전망 및 영향  \n• 구글의 제미나이와 오픈AI의 GPT 시리즈와 같은 AI 모델의 발전은 여러 산업 전반에 걸쳐 \n혁신을 주도하고 있으며 , 특히 인간과 유사한 반응을 이해하고 생성하는 능력은 고객 서비스 , \n콘텐츠 생성, 심지어 헬스케어 분야에서 보다 정확하고 효율적인 솔루션을 제공할 것으로 기대됨\n• 이러한 발전은 기술 혁신을 넘어 고용 시장과 경제에까지 영향을 미침. AI 챗봇이 일상에 더욱 \n통합됨에 따라 인간 상호작용에 크게 의존하는 분야에서 직무 변동의 가능성이 있음. 한편 이는 \nAI 개발, 유지보수 및 윤리적 감독 분야에서 새로운 고용 기회를 창출하기도 함. 또한, AI \n챗봇의 사용은 기업의 상당한 비용 절감을 일으켜 경제 성장에 기여할 수 있음. 정책 입안자들은 \nAI 챗봇 기술의 이점과 사회적 함의의 균형을 맞추는 과제에 직면해 있으며 , AI가 인간의 \n능력을 대체하기보다는 강화하는 미래를 보장해야 할 것임',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.88
cosine_accuracy@3 1.0
cosine_accuracy@5 1.0
cosine_accuracy@10 1.0
cosine_precision@1 0.88
cosine_precision@3 0.3333
cosine_precision@5 0.2
cosine_precision@10 0.1
cosine_recall@1 0.88
cosine_recall@3 1.0
cosine_recall@5 1.0
cosine_recall@10 1.0
cosine_ndcg@10 0.9557
cosine_mrr@10 0.94
cosine_map@100 0.94

Training Details

Training Dataset

Unnamed Dataset

  • Size: 120 training samples
  • Columns: sentence_0 and sentence_1
  • Approximate statistics based on the first 120 samples:
    sentence_0 sentence_1
    type string string
    details
    • min: 11 tokens
    • mean: 17.52 tokens
    • max: 28 tokens
    • min: 102 tokens
    • mean: 554.25 tokens
    • max: 819 tokens
  • Samples:
    sentence_0 sentence_1
    1조 달러 클럽 기업에는 어떤 회사들이 포함되나요? 14 Ⅰ. ICT 국가 산업 현황
    5.ICT 주요 기업
    미국 ICT 기업 1위 ‘마이크로소프트 ’
    • 마이크로소프트 (Microsoft) 의 시가총액은 3조 290억 달러(약 4,043 조 7,150 억)로
    애플(Apple) 을 앞지르고 전 세계 시가총액 1위에 등극함
    • 시가총액을 기준으로 애플(Apple) 과 엔비디아 (NVIDIA) 는 미국 주요 ICT 기업에서 각각 2위,
    3위를 차지함
    미국 ‘1조 달러 클럽 기업’, 글로벌 시장 주도
    • 미국 주요 ICT 기업 중 시가총액이 1조 달러(약 1,335 조 원)가 넘는 기업은 6개사임 . ‘1조 달러
    클럽(The Trillion Dollar Club)’ 기업들은 미국과 글로벌 증시를 주도하고 있음
    [표 9] 미국 주요 ICT 기업 TOP10
    순위 기업명 시가총액 (달러) 사업 분야
    ①Microsoft
    (www.microsoft.com)3.029T검색엔진 , 클라우드 솔루션 등 소프트웨어
    및 IT 서비스
    ②Apple
    (www.apple.com)2.801T 기술 하드웨어 및 소프트웨어
    ③NVIDIA
    (www.nvidia.com)1.941T 반도체 , 그래픽 프로세서 및 칩셋
    ④Amazon
    (www.amazon.com)1.798T 전자상거래
    ⑤Alphabet
    (www.alphabet.com)1.701T검색엔진 , 클라우드 솔루션 등 소프트웨어
    및 IT 서비스
    ⑥Meta Platforms
    (meta.com)1.233T소프트웨어 및 IT 서비스 , 인터넷 ,
    메타버스
    ⑦Broadcom
    (www.broadcom.com)597.54B 반도체 , 인프라 소프트웨어
    ⑧Oracle
    (www.oracle.com)306.99B 클라우드 컴퓨팅
    ⑨Salesforce
    (www.salesforce.com)290.17B 클라우드 컴퓨팅
    ⑩AMD
    (www.amd.com)285.25B마이크로프로세서 , 칩셋, 그래픽 칩 및
    SoC(시스템 온 칩) 솔루션
    출처 : Companies Marketcap
    드론 배송 기술 발전이 환경에 미치는 영향은 어떤가요? 21 Ⅱ. ICT 이슈 Top10
    ④미국, 드론 배송 도입 활발
    월마트와 아마존 , 드론 배송 서비스 확대
    • 월마트는 댈러스 -포트워스 (Dallas-Fort Worth, DFW) 지역에서 드론 배송 서비스를 대폭
    확장하고 있으며 , 미국 소매업체 중 가장 큰 드론 배송 네트워크 구축을 목표로 함. 월마트의
    드론 배송 서비스는 DFW 지역 전체 인구의 75%에 해당하는 1,800 만 가구에 서비스를 제공할
    예정이며 , 이 서비스는 고객이 원하는 상품을 몇 분 만에 받아볼 수 있도록 편의성을 극대화함
    • 아마존은 텍사스주 칼리지 스테이션 (College Station) 에서 아마존 약국 고객을 대상으로 드론을
    이용한 처방약 배송 서비스를 시작함 . 이 서비스를 통해 고객은 60분 이내에 500여 가지의
    약품을 배송받을 수 있으며 , 아마존은 드론 배송의 가능성을 넓히고 고객에게 더욱 빠르고
    편리한 서비스를 제공함
    집라인과 윙, 고도의 드론 배송 기술 개발
    • 집라인 (Zipline) 은 차세대 드론 배송 시스템을 공개하며 , 정밀 배송이 가능한 자율주행
    드로이드를 테더로 낮추어 정확한 위치에 물품을 배송함 . 집라인은 이미 아프리카와 호주에서
    성공적인 배송을 수행해왔으며 , 미국 내에서도 이 기술을 통해 더 많은 고객에게 서비스를
    제공할 계획임
    • 윙(Wing) 은 자동화된 윙 배송 네트워크를 발표하였으며 , 이는 우버(Uber) 가 운전자를
    배치하는 것과 유사한 방식으로 드론을 효율적으로 배치하여 물품을 배송함 . 윙의 기술은 배송
    과정을 자동화하고 드론 배송의 효율성과 안전성을 높이는 데 중점을 둠. 윙은 미국 내에서
    드론 배송 서비스를 확장하여 배송 시간을 단축하고 환경에 미치는 영향을 줄이고자 함
    FAA 규제 완화로 드론 배송 시장 전망 밝아
    • 미국 연방항공청 (Federal Aviation Administration, FAA)은 집라인과 같은 기업들에게
    비가시권 드론 운영(Beyond Visual Line of Sigh...
    미국과 싱가포르 간의 기술 파트너십의 주요 목적은 무엇인가요? 24 Ⅱ. ICT 이슈 Top10
    ⑦미국, 기술 교류를 위한 국가 간 협력 활발
    싱가포르와의 전략적 기술 파트너십 강화
    • 로렌스 웡(Lawrence Wong) 싱가포르 부총리의 워싱턴 D.C. 방문을 계기로 , 미국과 싱가포르는
    미-싱가포르 중요 및 신흥 기술(CET) 대화를 시작함 . 대화는 연구, 혁신 및 상업적 관계를
    강화하여 과학적 지식의 국경을 확장하고 번영을 촉진하는 것을 목표로 하며, 인도-태평양 지역,
    특히 아세안 (ASEAN) 파트너에 공공재를 전달하는 데 중점을 두고 주요 신흥기술에 협력하고자 함
    • 기술 파트너십을 확대하고 심화하기 위해 양국은 새로운 양자 이니셔티브를 구축함 . 여기에는
    안전하고 책임있는 AI 공유 원칙을 발전시키는 데 중점을 둔 양자 AI 거버넌스 워킹그룹의
    설립이 포함됨 . 또한, 공동 연구 및 교육 자금 지원을 통한 미국 국립과학재단 (NSF)과 AI
    싱가포르 (AISG) 의 협업은 상호 기술 발전과 안전에 대한 헌신을 강조함
    EU와 사이버 보안 협력 증진
    • 브뤼셀에서 열린 제9차 EU-미국 사이버 대화는 EU와 미국 간의 탄력적인 사이버 보안
    파트너십을 강화하는 중요한 단계임 . 양측은 개방적이고 상호 운용 가능한 인터넷과 사이버
    공간의 안정성에 대해 논의함 . 이 대화는 악화된 글로벌 사이버 위협 환경에 직면한 대서양 간
    협력과 조율을 입증하는 것으로 , 사이버 보안에 대한 EU-미국 간 협력의 심화 필요성을 강조함
    • 사이버 대화 과정에서 유럽연합 사이버보안청 (ENISA) 과 미국 사이버보안 및 인프라 보안청
    (CISA) 은 인식과 훈련, 우수 사례 교환, 공동 상황 인식을 위한 지식 공유 등을 주제로 워킹
    어레인지먼트를 공식화함 . 양국은 글로벌하고 개방적이며 안전한 사이버 공간을 추진하기 위한
    우선순위를 정하면서 , 사이버보안 표준과 관행을 발전시키기 위해 협력하기로 함
    영국과 AI 안전 협력 파트너십 발표
    • 런던과 워싱턴은 미 백악관이 인공지능 개발에 배치한 새로운 가드...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 10
  • per_device_eval_batch_size: 10
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 10
  • per_device_eval_batch_size: 10
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 3
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • tp_size: 0
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: round_robin

Training Logs

Epoch Step cosine_ndcg@10
1.0 12 0.9631
2.0 24 0.9557
3.0 36 0.9557

Framework Versions

  • Python: 3.11.10
  • Sentence Transformers: 3.4.1
  • Transformers: 4.51.3
  • PyTorch: 2.4.1+cu124
  • Accelerate: 1.6.0
  • Datasets: 3.5.0
  • Tokenizers: 0.21.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}