VALL-E побудована на основі технології EnCodec. AI генерує окремі коди аудіокодеків із текстових і акустичних підказок: аналізує, як звучить людина, розбиває цю інформацію на окремі компоненти («токени») завдяки EnCodec і використовує навчальні дані, щоб узгодити те, що він «знає» про те, як цей голос звучатиме, якби він вимовляв інші фрази.
VALL-E може імітувати тембр та манеру мови зі збереженням емоційного тону мовця та акустичного середовища.
Microsoft навчила можливості синтезу мовлення VALL-E на аудіотеці LibriLight, зібраній Meta. Він містить 60 000 годин мовлення англійською з понад 7 000 носіїв.
Amazon запустила платформу, на якій можна створити свою лінію мерчу
Спостереження за відбудовою: UNITED24 та ЛУН запустили спільний проєкт
Компанія BRG hotels оновила логотип
«Житомирські Ентузіасти» створили віртуальну екскурсію музеєм космонавтики
Проєкт Directa Design Bureau для бренду кави здобув Red Dot
Мистецький арсенал презентує онлайн-видання «Україна в огні»