본문 바로가기
반응형

AI7

AI 인공지능 & 머신러닝 & 딥러닝 개요 인공지능 인공지능은 사람이 수행하는 지능적인 작업을 자동화하기 위한 연구 활동 일반적으로 컴퓨터 프로그램이 하는 일들은 입력되어 있는 로직을 바탕으로 동작하기에 단순한 작업들을 수행하기에는 뛰어난 반면, 더 나아가 사람의 말을 이해하거나 사람 얼굴을 인식하는 등의 작업들은 단순히 개발자가 짠 로직만으로는 성능이 많이 떨어짐 수많은 케이스가 입력되어도 정확도가 높은 결과를 제시하기 위해선 사람의 뇌와 같이 지능적인 작업을 하는 도구가 필요함 머신러닝 현재 인공지능을 구현하기 위한 방식으로는 크게 규칙 기반 시스템(Rule-based system)과 머신러닝 2가지로 나뉨 규칙 기반 시스템: Rule(규칙)을 미리 프로그래머가 작성하는 방식 수많은 경우의 수에 대응하는 .. 2023. 7. 26.
GAN GAN GAN은 Generative Adversarial Nets이라는 논문을 통해 나온 모델로 진짜와 동일해 보이는 이미지를 생성하는 모델이다. GAN은 크게 3가지 Unconditional GAN, Conditional GAN, Super Resolution으로 분류된다. 초기 GAN의 아키텍처는 다음과 같이 Generator(생성자)와 Discriminator(판별자)로 구성되었다. GAN은 Generator와 Discriminator로 이루어져 있어 동시에 두 개의 모델을 훈련하는 것이 특징이다. 여기서 z라고 하는 것은 랜덤 벡터 z를 의미하는 것으로 오른쪽 그림의 uniform distribution이나 normal distribution을 따른다고 한다. 이 랜덤 벡터 z를 Generator.. 2023. 4. 3.
Whisper Whisper(Web-scale Supervised Pre-training for Speech Recognition) 2022년 9월 OpenAI에서 공개한 트랜스포머 기반의 음성 인식 모델로, 68만 시간 이상의 음성 데이터를 학습하여 인간의 인식과 비슷한 수준의 성능을 확보하였다. 음성을 인식하여 텍스트로 변환하거나 번역을 수행할 수 있으며 현재 large-v2 버전이 업데이트되어 API로 이용할 수 있다. Encoder의 입력 데이터가 음성 파일인 것을 제외하면 일반적인 트랜스포머 구조를 가지고 있다. Special token을 활용하여 다양한 Task가 가능하도록 설계되었다. 한국어 데이터가 학습 데이터에 높은 비율로 포함되어 있어, 한국어 서비스에의 활용이 기대가 된다. Whisper API 사.. 2023. 4. 3.
ChatGPT ChatGPT란 GPT(Generative Pre-trained Transformer)-3는 OpenAI에서 공개한 트랜스포머 구조 기반의 사전 학습된 언어 생성 모델로, 인간과 유사한 텍스트를 생성할 수 있다. https://jobdahan-tech.tistory.com/entry/Transformer Transformer Transformer Transformer는 RNN 언어 모델에서부터 시작었다. 기존의 RNN은 하나의 고정된 크기의 벡터(Context vector)에 모든 정보를 압축하므로 정보 손실이 발생하며 순차적 입력 구조 때문에 먼저 입력 jobdahan-tech.tistory.com GPT-3는 약 1750억 개의 파라미터를 가지고, 메타 학습(Meta learning)과 인간의 피드백.. 2023. 4. 3.
Transformer Transformer Transformer는 RNN 언어 모델에서부터 시작었다. 기존의 RNN은 하나의 고정된 크기의 벡터(Context vector)에 모든 정보를 압축하므로 정보 손실이 발생하며 순차적 입력 구조 때문에 먼저 입력된 단어의 정보가 잘 반영되지 않는(Vanishing gradient) 단점이 존재한다. 이를 보정해주기 위한 어텐션(Attention) 기법이 등장했지만, 순차적 입력 구조는 그대로이므로 성능 개선에 한계가 있다. 어텐션은 입력 문장 내의 단어들끼리 유사도를 구함으로써 특정 단어와 연관된 확률이 높은 단어를 찾으므로 RNN의 정보 손실 문제를 해결할 수 있다. 트랜스포머는 각 단어의 임베딩 벡터에 위치 정보들을 더하여 모델의 입력으로 사용(Positional encoding.. 2023. 4. 3.
Naver Clova Naver Clova 네이버 클로바(Naver Clova)는 네이버에서 개발한 인공지능 플랫폼이며 검색 기능, 날씨 정보, 음악 추천 및 재생, 번역, 영어 프리토킹 등 다양한 기능들을 제공한다. 이러한 다양한 AI 서비스 중 무료로 체험해볼 수 있는 Clova sentiment, Summary 서비스를 이용해보도록 한다. Clova Sentiment 한국어에 최적화된 감정 분석 기술 서비스로 블로그, 댓글, SNS 등 한글로 작성된 글 속에 표현된 감정을 분석해 주는 API이다. Clova Sentiment 예시 Clova Sentiment 요금 Clova Summary 문서 주제와 관계 없이 사용할 수 있는 API로 문서에서 가려낸 주요 내용을 기반으로 전체 내용을 간결하게 요약한다. Clova Su.. 2023. 4. 3.
AI 서비스 구축 스터디 시작 IT 회사에서 데이터 분석가로 시작하여 기획부서로 넘어오며 기존에 전공을 하며 관심을 가졌던 데이터 분석, ML, DL 등의 데이터 분야에 점점 멀어지는 것에 아쉬움을 느끼던 차, 회사에서 AI 서비스 구축 스터디를 참여하게 되었다. 처음 기획부서에 넘어왔을 때, 데이터를 이용한 분야는 기술의 발전이 빠르고 기술의 R&D 분야에서는 너무 뛰어난 사람이 많으며 AI가 점점 발전하며 대체될 것이라 생각하였고 이를 따라가는 것보다 잘 활용하는 능력이 더욱 중요해질 것이라 생각하여 기획에 관심을 갖게 되었다. 하지만 현실적으로 회사에서 내가 원하는 기획을 해볼 수 있는 기회가 없고, 간단한 웹/앱이라도 통째로 서비스를 기획하고 구축하는 프로세스를 경험하는 것이 쉽지 않다는 것을 알게 되었다. 이번 스터디를 계기.. 2023. 4. 3.
반응형