본문 바로가기

생성 AI3

(2/2) AudioGen: Textually Guided Audio Generation 리뷰 앞선 내용은 AudioGen: Textually Guided Audio Generator 1부에서 읽어주세요 (1/2) AudioGen: Textually Guided Audio Generation 리뷰 안녕하세요, 오늘은 AudioGen: Textually Guided Audio Generation 논문을 살펴보도록 하겠습니다. 논문 제목은 AudioGen인데 코드나 블로그에서는 AudioCraft라고 소개하고 있습니다. 프로젝트 이름이 AudioCraft, thecho7.tistory.com Audio Representation 먼저 좋은 Audio representation을 얻기 위해 Auto-encoder를 제대로 학습해야 합니다. 아래는 그 과정에서 가장 중요한 Training objectiv.. 2023. 8. 6.
(1/2) AudioGen: Textually Guided Audio Generation 리뷰 안녕하세요, 오늘은 AudioGen: Textually Guided Audio Generation 논문을 살펴보도록 하겠습니다. 논문 제목은 AudioGen인데 코드나 블로그에서는 AudioCraft라고 소개하고 있습니다. 프로젝트 이름이 AudioCraft, 모델 이름이 AudioGen입니다. 이번 논문은 제목처럼 텍스트를 입력으로 받아 그에 맞는 소리를 생성하는 생성 AI입니다. 일전에 소개드렸던 ImageBind 리뷰처럼 비슷한 연구가 있어 아주 참신하지는 않지만 어떤 특징을 갖고 어떤 장점이 있는지 설명하겠습니다. 참고로 이 글은 블로그와 논문을 함께 참고하며 작성했습니다. 블로그: AudioCraft 코드: AudioCraft Github 논문: 논문 링크 Introduction 소리를 생성하는.. 2023. 8. 3.
[논문 리뷰] Consistency Models 리뷰 안녕하세요, 오늘은 OpenAI에서 발표한 Consistency Models을 소개합니다. 이 모델은 기존 Diffusion models이 노이즈로부터 원본 이미지 복원을 위해 수백번 ~ 수천번의 iteration을 반복하는 과정을 획기적으로 줄였다고 합니다. 저는 생성 모델의 전문가가 아니라서 심도 있는 내용은 없지만 본 설명이 이해에 도움이 된다면 좋겠습니다. 논문: https://arxiv.org/pdf/2303.01469.pdf Github: https://github.com/openai/consistency_models Introduction 최근 득세하고 있는 Diffusion Models... 그 이전에 한참을 유행했던 GAN(Generative Adversarial Network)에는 없는.. 2023. 4. 13.