چالش‌های هوش مصنوعی در موسیقی - ایسنا

چالش‌های هوش مصنوعی در موسیقی

این روزها با ظهور موسیقی دیپ‌فیک، صداهای شبیه‌سازی‌شده هنرمندان مشهور، از ایران تا جهان، در شبکه‌های اجتماعی و پلتفرم‌های استریم پخش می‌شوند. هرچند برخی آثار خلاقانه و جذاب هستند، اما نبود قوانین مشخص، مسائل اخلاقی، حقوقی و مالی و حتی خطر آسیب روانی به هنرمندان، این پدیده را به یکی از چالش‌برانگیزترین موضوعات صنعت موسیقی تبدیل کرده است.

به گزارش ایسنا، این روزها آهنگ‌های جدیدی از هنرمندان مشهور ایرانی و خارجی در شبکه‌های اجتماعی وایرال می‌شوند که عمدتا مشکلی ندارد، مگر آنجا که آن اثر جدید تنها صدای شبیه‌سازی‌شده این خواننده‌ها را دارا باشد. این در حالی است که موسیقی یکی از آخرین حوزه‌هایی بود که در برابر این فناوری مقاومت می‌کرد، اما اکنون «دیپ‌فیک» در موسیقی هم به واقعیت تبدیل شده است.

این کار با آموزش دادن یک مدل هوش مصنوعی بر اساس صدای یک خواننده انجام می‌شود و نتیجه همیشه هم بد نیست. بعضاً حتی خلاقیت زیادی هم در ساخت این آهنگ‌های دیپ‌فیک به کار می‌رود. اما مسئله فقط کیفیت خروجی نیست. در بسیاری از موارد، اجازه‌ای از صاحب صدا گرفته نمی‌شود و پرسش‌هایی مثل اینکه چه کسی باید دستمزد استریم آن آهنگ را بگیرد و آیا این کار از نظر اخلاقی درست است یا نه، از جمله چالش‌های اصلی موسیقی دیپ‌فیک به شمار می‌آیند.

دیتاست‌های بدون مجوز

اگر بخواهید یک قطعه دیپ‌فیک از یک هنرمند مشهور بسازید، باید فایل‌های صوتی صدای خوانندگی او را جمع‌آوری کرده و در قالب یک دیتاست استفاده کنید. همان‌طور که درباره هر داده‌ای که متعلق به فردی است باید اجازه گرفت، در این مورد هم منطقی است که رضایت صاحب صدا دریافت شود؛ اما با این حال، بسباری از آهنگ‌های دیپ‌فیک بخصوص در ایران با استفاده از دیتاست‌های بدون مجوز ساخته می‌شوند و حتی به پلتفرم‌های بزرگ موسیقی مثل یوتیوب، اسپاتیفای یا تیک‌تاک راه پیدا می‌کنند.

این اتفاق در جهان برای دو هنرمند، Drake و The Weeknd، رخ داد؛ زمانی که کاربری با نام Ghostwriter آهنگی به نام Heart on My Sleeve ساخت. این قطعه شامل صداهای تولیدشده با هوش مصنوعی بود که به‌طور مصنوعی شبیه صدای این دو هنرمند ساخته شده بود و حتی به رابطه قبلی The Weeknd هم در ترانه اشاره می‌کرد.

بسیاری از طرفداران از این آهنگ استقبال کردند و حتی خلاقیت Ghostwriter در استفاده از صدای دیپ‌فیک را تحسین کردند. اما همان‌طور که روزنامه The Seattle Times گزارش داد، همه چنین نگاهی نداشتند. سخنگوی شرکت Universal Music Group، که ناشر اصلی هر دو هنرمند است، این پرسش را مطرح کرد: «ذی‌نفعان صنعت موسیقی می‌خواهند در کدام سوی تاریخ بایستند؟ در کنار هنرمندان، طرفداران و خلاقیت انسانی، یا در کنار دیپ‌فیک‌ها، تقلب و محروم کردن هنرمندان از دستمزد و حق‌وحقوق‌شان؟»

قوانین قدیمی کپی‌رایت

اگر هنرمندی باشید که نمی‌خواهد صدایش شبیه‌سازی شود، قوانین کپی‌رایت فعلاً شاید نتوانند کمکی به شما بکنند. از آنجا که قوانین حق‌ نشر جهانی در زمانی نوشته شده‌اند که چنین فناوری‌های هوش مصنوعی‌ای وجود نداشت، طبیعی است که قانون هنوز در حال تلاش برای همگام شدن با این تحولات باشد.

نزدیک‌ترین پرونده حقوقی مرتبط با «سرقت صدا» در ایالات متحده به دهه ۱۹۹۰ برمی‌گردد. همان‌طور که روزنامه Los Angeles Times گزارش داده، خواننده Tom Waits توانست ۲.۴۷۵ میلیون دلار غرامت از شرکت Frito-Lay Inc دریافت کند؛ غول بزرگ تولید چیپس که برندهایی مانند Doritos, Cheetos و Cracker Jack’s را در اختیار دارد.

در آن آگهی تبلیغاتی از صدای فردی استفاده شده بود که آن‌قدر به صدای Tom Waits شباهت داشت که ممکن بود مردم تصور کنند خودِ او پشت این کمپین تبلیغاتی قرار دارد. درباره آهنگ‌های دیپ‌فیکی که امروز در حال انتشار هستند هم می‌توان همین را گفت؛ با این تفاوت که موسیقی تولیدشده با هوش مصنوعی هنوز در یک نبرد حقوقی جدی مورد آزمون قرار نگرفته است.

در حالی که منتظر به‌روزرسانی نظام حقوقی هستیم، بد نیست اشاره کنیم که همه هنرمندان با شبیه‌سازی صدای خود مخالف نیستند. برای مثال، Holly Herndon در مواجهه با موج رو به‌ رشد اپلیکیشن‌های موسیقی مبتنی بر هوش مصنوعی، تصمیم گرفت نسخه صوتی دوقلوی خود با نام Holly+ را به‌صورت رسمی مجاز اعلام کند و هم‌زمان سیستمی ایجاد کند که دستمزد منصفانه‌ای برایش تضمین شود.

در نهایت، فارغ از اینکه هنرمندان در کدام سو می‌ایستند، مسئله اصلی همچنان پابرجاست: قانون مشخص و صریحی در زمینه کپی‌رایت وجود ندارد که تصریح کند پیش از استفاده از صدای یک هنرمند باید از او اجازه گرفته شود. تا آن زمان، هنرمندان ممکن است خود را در «غرب وحشی» فناوری هوش مصنوعی ببینند؛ جایی که قانونی روشن برای هدایت آن‌ها وجود ندارد.

البته کلیه موارد ذکرشده در این گزارش چندان در ایران دارای مصداق ندارد؛ چراکه حتی قوانین عادی کپی‌رایت هم در ایران رعایت نمی‌شود چه برسد به وضع قوانینی برای استفاده از هوش مصنوعی در موسیقی.

چه کسی پول می‌گیرد؟

آیا درست است که با استفاده از صدای یک نفر از موسیقی کسب درآمد شود؟ این پرسشی پیچیده و چالش‌برانگیز است؛ پرسشی که احتمالاً با انتشار هرچه بیشتر موسیقی‌های دیپ‌فیک در پلتفرم‌های استریم و کسب درآمد از آن‌ها در شبکه‌های اجتماعی، به مسئله‌ای بزرگ‌تر تبدیل خواهد شد.

همان‌طور که می‌دانیم، اجرای کاورِ یک آهنگ مشهور و انتشار آن در یوتیوب یا اسپاتیفای اشکالی ندارد. در آن حالت، عناصری مثل شعر، ساختار قطعه، ملودی، ریتم و غیره بازخوانی یا کپی می‌شوند و چارچوب‌های قانونی مشخصی هم برایش وجود دارد. اما کلون‌های صوتی کاملاً متفاوت‌اند. موسیقی دیپ‌فیک صرفاً بازنوازی یا الهام گرفتن از یک قطعه موجود نیست، بلکه ساختن یک آهنگ کاملاً جدید با استفاده از صدای شخص دیگری است.
به بیان دیگر، اگر ابزارهای هوش مصنوعی و دیتاست‌های بدون مجوز وجود نداشتند، کلون‌های صوتی هم به وجود نمی‌آمدند. هنرمندان یک عمر زمان صرف می‌کنند تا صدایی را که با آن متولد شده‌اند پرورش دهند و هویتی منحصربه‌فرد برای خود بسازند. دزدیدن صدای یک نفر و کسب درآمد از آن، ممکن است قدمی فراتر از حد قابل‌قبول باشد.

ژانری در منطقه خاکستری

برای پیچیده‌تر شدن ماجرا، برخی افراد موسیقی دیپ‌فیک را کاملاً منفی نمی‌دانند. برخلاف تصاویر یا ویدئوهای دیپ‌فیک که شاید لحظه‌ای به آن‌ها بخندید و بعد در گوشی‌تان از کنارشان رد شوید، موسیقی دیپ‌فیک در حال شکل دادن به ژانری مستقل برای خود است.

بعضی‌ها آن را با «فن‌فیکشن» مقایسه می‌کنند؛ شیوه‌ای خلاقانه و سرگرم‌کننده برای ادای احترام به یک هنرمند. این نگاه مثبت باعث می‌شود نتوان به‌سادگی موسیقی دیپ‌فیک را صرفاً یک امر ممنوع یا تابو دانست. کافی است به رویکرد Holly Herndon در زمینه شبیه‌سازی صدای مبتنی بر هوش مصنوعی نگاهی بیندازید.
با این حال، همه موافق نیستند که چنین موسیقی‌ای باید مجاز باشد. همان‌طور که روزنامه Financial Times نوشته است، شرکت بزرگ ضبط موسیقی Universal Music Group تلاش کرده آثار کم‌کیفیت، از جمله قطعات ساخته‌شده با هوش مصنوعی، از پلتفرم‌های استریم حذف شوند. در نهایت، پلتفرم‌هایی مانند Spotify، Apple Music یا Tidal ناچار خواهند بود تصمیم بگیرند که آیا این نوع موسیقی را در بستر خود مجاز می‌دانند یا نه.

موسیقی دیپ‌فیک بحث‌هایی مشابه آنچه را پیش‌تر در دنیای هنر جریان داشته شعله‌ور کرده است: آیا آثار تولیدشده با هوش مصنوعی باید «هنر» محسوب شوند؟ این‌بار اما، پرسش درباره موسیقیِ ساخته‌شده با هوش مصنوعی مطرح شده است.

نگرانی‌های اخلاقی درباره نژاد و هویت
دوران موسیقی دیپ‌فیک با موجی از آثاری آغاز شده که عمدتاً از موسیقی رپ تقلید می‌کنند. با توجه به اینکه ریشه‌های تاریخی این ژانر به جوانان آفریقایی‌ـ‌آمریکایی ساکن برانکسِ نیویورک در اوایل دهه ۱۹۷۰ بازمی‌گردد، برخی افراد نسبت به مسئله نژاد و هویت در موسیقی مبتنی بر هوش مصنوعی ابراز نگرانی کرده‌اند.

نویسنده، Lauren Chanel، یکی از کسانی است که موسیقی دیپ‌فیک را مشکلی جدی می‌داند. او در مقاله‌ای که در The New York Times منتشر شده، می‌گوید: «این هم راه دیگری است برای اینکه افرادی که سیاه‌پوست نیستند، لباس یک فرد سیاه‌پوست را بپوشند، دستان‌شان را بالا ببرند و کانیه وست یا دریک را مثل یک عروسک به حرکت درآورند و این برای من نگران‌کننده است. این فقط نمونه دیگری در زنجیره‌ای طولانی از کم‌اهمیت شمردن تلاشی است که برای خلق هنری لازم است که از نظر تاریخی، سیاه‌پوستان آن را پدید آورده‌اند.»

این نخستین بار نیست که موسیقی ساخته‌شده با ابزارهای هوش مصنوعی از نظر اخلاقی مسئله‌ساز می‌شود. همان‌طور که مجله Rolling Stone گزارش داده، یک رپر آواتاری مجازی به نام FN Meka با یک شرکت موسیقی قرارداد امضا کرد، اما پس از آن که گروه آنلاین حقوق مدنی Industry Blackout اعلام کرد این پروژه «کلیشه‌های زننده‌ای» درباره فرهنگ سیاه‌پوستان را بازتولید می‌کند، به‌سرعت کنار گذاشته شد.
در نهایت، موسیقی دیپ‌فیک به ما یادآوری می‌کند که ابزارهای هوش مصنوعی را نمی‌توان از تاریخ شکل‌گیری و تولید موسیقی جدا دانست؛ نادیده گرفتن این پیشینه، می‌تواند بر خطرات دیپ‌فیک‌های مبتنی بر هوش مصنوعی بیفزاید.

آسیب رساندن به هنرمندان

نکته‌ای که نباید نادیده گرفته شود، تأثیر احساسی و روانی‌ای است که یک آهنگ دیپ‌فیک می‌تواند بر هنرمند بگذارد؛ به‌ویژه وقتی یک صدای شبیه‌سازی‌شده درباره اتفاق‌هایی می‌خواند که هرگز رخ نداده‌اند، احساساتی را بیان می‌کند که متعلق به او نیستند و وانمود می‌کند به چیزهایی اهمیت می‌دهد که شاید واقعاً برایش مهم نباشند.
در ماجرای آهنگ جعلیِ Drake با حضور The Weeknd، در متن ترانه به Selena Gomez اشاره شده بود؛ کسی که پیش‌تر با The Weeknd در رابطه بود. ترکیب واقعیت‌های زندگی شخصی با اشعار ساختگی، نوعی تحریف عجیب از واقعیت ایجاد کرده بود که می‌توانست برای هنرمندی که آن تجربه واقعی را پشت سر گذاشته، آزاردهنده باشد.

به همین ترتیب، تولید اشعار ساخته‌شده با هوش مصنوعی «به سبکِ» یک هنرمند مشهور، با استفاده از ابزارهای تولید متن، باعث شده برخی هنرمندان نسبت به گسترش این فناوری احساس ناامیدی کنند. همان‌طور که Nick Cave می‌گوید: «آنچه ChatGPT در این مورد انجام می‌دهد، نوعی بازتولیدِ کاریکاتورگونه و تحریف‌آمیز است.»

موسیقی دیپ‌فیک این توانایی را دارد که کلماتی را در دهان هنرمند بگذارد که هرگز بر زبان نیاورده یا در این مورد، هرگز نخوانده است. در سطح شخصی، این مسئله می‌تواند برای هنرمندی که کنترل چندانی بر حذف چنین محتوایی ندارد آسیب‌زا باشد، مگر اینکه بخواهد ماجرا را از طریق دادگاه پیگیری کند.

آماده شدن برای تغییرات در صنعت موسیقی

به لطف دسترسی روزافزون به ابزارهای هوش مصنوعی، موسیقی هم وارد دنیای دیپ‌فیک‌ها شده است؛ به‌ویژه از طریق شبیه‌سازی صدا. تشخیص تفاوت میان صدای تولیدشده با هوش مصنوعی و صدای واقعی انسان فقط با گوش دادن بسیار دشوار است و همین موضوع باعث می‌شود یک آهنگ دیپ‌فیک پیش از آن‌که حذف شود، به‌راحتی به پلتفرم‌های استریم راه پیدا کند.

از یک سو، ممکن است طرفداران از موسیقی دیپ‌فیک لذت ببرند و حتی ژانری معتبر شکل بگیرد که با استفاده از صداهای مشهور، آثار تازه و جذابی خلق کند. اما همه هنرمندان با شبیه‌سازی صدای خود موافق نیستند، و در حال حاضر هم قوانین مشخصی وجود ندارد که افراد را از ساخت دیتاست‌های بدون مجوز بازدارد.

کسب رضایت، پرداخت دستمزد به هنرمندان و بررسی مسائل اخلاقی، تنها بخشی از مشکلاتی هستند که هنرمندان و صنعت موسیقی با آن مواجه‌اند. با توجه به توسعه سریع فناوری هوش مصنوعی، لازم است که لحظه‌ای توقف کنیم و درباره مسائلی که این فناوری ایجاد کرده، تأمل کنیم.

انتهای پیام