مشاهده دسته‌بندی‌ها

تبدیل متن به گفتار - خروجی صوتی در اسکرچ

🔊 تبدیل متن به گفتار - خروجی صوتی در اسکرچ #

افزونه‌ی تبدیل متن به گفتار، صدای گفتاری واقع‌گرایانه را به پروژه‌های اسکرچ شما می‌آورد.
اسپرایت‌های خود را به صحبت وادارید، داستان روایت کنید، دستیارهای صوتی ایجاد کنید، ابزارهای یادگیری زبان بسازید و ویژگی‌های دسترسی را اضافه کنید - همه اینها با بلوک‌های ساده‌ای که متن را به گفتار با صدای طبیعی تبدیل می‌کنند.
در ۲۳ زبان با ۵ صدای منحصر به فرد کار می‌کند.


🌟 مرور کلی #

  • سنتز گفتار طبیعی: هر متنی را با صداهای واقعی به کلمات گفتاری تبدیل کنید.
  • ۲۳ زبان پشتیبانی شده: به زبان‌های انگلیسی، اسپانیایی، فرانسوی، آلمانی، چینی، عربی و بسیاری دیگر صحبت کنید.
  • ۵ صدای منحصر به فرد: زیر، بم، کودکانه، غول و بچه گربه‌ای - هر کدام با ویژگی‌های متمایز.
  • ادغام ساده: فقط یک بلوک برای اینکه اسپرایت‌های شما صحبت کنند!
  • تشخیص زبان: به طور خودکار زبان ویرایشگر شما را پیش‌فرض قرار می‌دهد.
  • مبتنی بر فضای ابری: از سرویس سنتز اسکرچ برای تولید گفتار با کیفیت بالا استفاده می‌کند.

✨ ویژگی‌های کلیدی #

  • ۵ شخصیت صوتی مجزا: طبیعی (زیر/بم)، بامزه (کودکانه/غول) و بازیگوش (بچه گربه‌ای).
  • ۲۳ زبان پشتیبانی شده با تلفظ طبیعی.
  • تطبیق خودکار زبان بر اساس زبان ویرایشگر.
  • انتخاب صدای متناسب با جنسیت برای هر زبان.
  • صداهای مبتنی بر شخصیت برای داستان‌سرایی خلاقانه
  • همگام‌سازی با انیمیشن‌ها و جلوه‌های صوتی اسکرچ.
  • ایده‌آل برای دسترسی‌پذیری، یادگیری زبان و روایت‌های تعاملی.

🚀 نحوه استفاده #

  1. بروید به: pishi.ai/play
  2. بخش افزونه‌ها را باز کنید.
  3. افزونه‌ی تبدیل متن به گفتار را انتخاب کنید.
  4. از بلوک «بگو» برای صحبت کردن اسپرایت خود استفاده کنید!
  5. (اختیاری) قبل از صحبت کردن، صدا و زبان را تنظیم کنید.
  6. اسپرایت شما متن را با صدای بلند می‌خواند - اسکرچ منتظر می‌ماند تا صحبت تمام شود.

نکات

  • این افزونه به‌طور خودکار زبان ویرایشگر شما را تشخیص می‌دهد و به‌طور پیش‌فرض از آن استفاده می‌کند.
  • برای ایجاد مکالمه، از صداهای مختلف برای شخصیت‌های مختلف استفاده کنید.
  • برای نمایش متن هنگام صحبت کردن، با بلوک‌های «فکر کن به» یا «بگو» ترکیب کنید.
  • با اتصال به اینترنت بهترین عملکرد را دارد - به سرویس سنتز گفتار ابری نیاز دارد.
  • برای بهترین عملکرد، متن را زیر ۱۲۸ کاراکتر نگه دارید.

🧱 بلوک‌ها و توابع #

 

🗣️ بلوک گفتار اصلی #

بگو [WORDS|text]

متن را به گفتار تبدیل می‌کند و آن را به صورت صوتی پخش می‌کند.
متن تا پایان گفتار منتظر می‌ماند و سپس ادامه می‌دهد - ایده‌آل برای داستان‌سرایی همزمان.

چگونه کار می‌کند:

  • متن مورد نظر برای خواندن را تایپ یا وارد کنید.
  • این بلوک متن را به سرویس سنتز اسکرچ ارسال می‌کند.
  • صدا با زبان و صدای انتخاب شده تولید می‌شود.
  • صدا از طریق بلندگوها/هدفون‌های شما پخش می‌شود.
  • بلوک منتظر می‌ماند تا گفتار کامل شود و سپس به بلوک بعدی می‌رود.

آرگومان‌ها:

  • WORDS - متن برای صحبت (رشته، تا 128 کاراکتر)

مثال‌ها:

  • بگو [سلام، اسم من گربه‌ی اسکرچ است!|text]
  • بگو [رنگ مورد علاقه شما چیست؟|text]

توجه: این بلوک منتظر تکمیل گفتار می‌ماند - از آن برای گفتگو، روایت و انیمیشن‌های هماهنگ استفاده کنید.

 


🎭 انتخاب صدا #

صدا [VOICE] شود

شخصیت صدا را برای سنتز گفتار تغییر می‌دهد.
هر صدا شخصیت منحصر به فردی دارد - مناسب برای شخصیت‌ها یا حالات مختلف.

صداهای موجود:

  • زیر - صدای طبیعی و با جنسیت نامعلوم (پیش‌فرض) - حرفه‌ای، واضح
  • بم - صدای طبیعی و با جنسیت نامعلوم - کمی بم‌تر از صدای پیش‌فرض
  • کودکانه - صدای زیر و بازیگوشانه - عالی برای شخصیت‌های کوچک، سخنرانی‌های هیجان‌انگیز
  • غول - صدای بم و عمیق - مناسب برای شخصیت‌های بزرگ و لحن‌های جدی
  • بچه گربه‌ای - صدای کودکانه فوق‌العاده بلند - برای همه کلمات «میو» می‌کند (افکت شخصیت بامزه!)

مثال‌ها:

  • صدا [زیر] شود ← صدای طبیعی استاندارد
  • صدا [کودکانه] شود ← صدای بلند و پرانرژی
  • صدا [غول] شود ← صدای عمیق و جدی
  • صدا [بچه گربه‌ای] شود ← شخصیت گربه (می‌گوید «میو میو میو»)

کاربردهای خلاقانه:

  • از صدای زیر (alto) برای راویان، معلمان یا شخصیت‌های حرفه‌ای استفاده کنید.
  • از صدای بم (tenor) برای قهرمانان، رهبران یا شخصیت‌های با اعتماد به نفس استفاده کنید.
  • از صدای کودکانه (squeak) برای جن و پری، بچه‌ها، ربات‌ها یا احساسات برانگیخته استفاده کنید.
  • از صدای غول (giant) برای هیولاها، شخصیت‌های شرور، چهره‌های قدرتمند یا لحظات جدی استفاده کنید.
  • از صدای بچه گربه‌ای (kitten) برای شخصیت‌های حیوان خانگی یا جلوه‌های کمدی استفاده کنید.

 


🌍 انتخاب زبان #

زبان [LANGUAGE] شود

زبان سنتز گفتار را تغییر می‌دهد
افزونه به‌طور خودکار زبان ویرایشگر شما را پیش‌فرض قرار می‌دهد، اما می‌توانید آن را برای پروژه‌های چندزبانه لغو کنید.

زبان‌های پشتیبانی‌شده (در مجموع ۲۳ زبان):

  • انگلیسی (en) – تلفظ انگلیسی آمریکایی
  • اسپانیایی (اروپایی) (es) – اسپانیایی کاستیلی
  • اسپانیایی (آمریکای لاتین) (es-419) – اسپانیایی آمریکای لاتین
  • فرانسوی (fr) – تلفظ فرانسوی
  • آلمانی (de) – تلفظ آلمانی
  • ایتالیایی (it) – تلفظ ایتالیایی
  • پرتغالی (برزیلی) (pt-br) – پرتغالی برزیل
  • پرتغالی (برزیلی) (pt) – پرتغالی اروپایی
  • چینی (ماندارین) (zh-cn) – چینی ماندارین (ساده شده و سنتی)
  • ژاپنی (ja) – تلفظ ژاپنی
  • کره‌ای (ko) - تلفظ کره ای
  • عربی (ar) - عربی استاندارد مدرن
  • هندی (hi) – تلفظ هندی
  • روسی (ru) – تلفظ روسی
  • هلندی (nl) – تلفظ هلندی
  • لهستانی (pl) – تلفظ لهستانی
  • ترکیه‌ای (tr) – تلفظ ترکیه‌ای
  • دانمارکی (da) – تلفظ دانمارکی
  • سوئدی (sv) – تلفظ سوئدی
  • نروژی (nb) – بوکمال نروژی
  • ایسلندی (is) – تلفظ ایسلندی
  • رومانیایی (ro) – تلفظ رومانیایی
  • ولزی (cy) – تلفظ ولزی

چگونه کار می‌کند:

  • این افزونه به‌طور خودکار زبان را مطابق با زبان ویرایشگر اسکرچ شما (در صورت پشتیبانی) تنظیم می‌کند.
  • از این بلوک برای لغو پیش‌فرض یا ایجاد پروژه‌های چندزبانه استفاده کنید.
  • تنظیمات زبان به همراه پروژه ذخیره می‌شود.
  • بعضی از زبان‌ها فقط صدای زنان را پشتیبانی می‌کنند - این افزونه به‌طور خودکار زیر و بمی صدا را تنظیم می‌کند.

مثال‌ها:

  • زبان [اسپانیایی (آمریکای لاتین)] شود ← به زبان اسپانیایی صحبت کنید
  • زبان [فرانسوی] شود ← به زبان فرانسوی صحبت کنید
  • زبان [ژاپنی] شود ← به زبان ژاپنی صحبت کنید

پروژه‌های یادگیری زبان:

  • پروژه‌هایی ایجاد کنید که تلفظ را در زبان‌های مختلف آموزش دهند.
  • آزمون‌های واژگان چندزبانه بسازید.
  • ترجمه داستان را با صدای گفتاری انجام دهید.
  • تمرین درک شنیداری زبان.

نکته‌ای در مورد زبان‌های تک‌جنسیتی:
برخی از زبان‌ها (عربی، چینی، هندی، کره‌ای، نروژی، رومانیایی، سوئدی، ترکی، ولزی) فقط صدای زن را از سرویس سنتز صدا پشتیبانی می‌کنند. این افزونه به‌طور خودکار زیر و بمی صدا را برای صداهای بم و غول در این زبان‌ها تنظیم می‌کند.

 


🎓 کاربردهای آموزشی #

  • قابلیت دسترسی: برای کاربران کم‌بینا یا کسانی که توانایی خواندن ندارند، روایت صوتی اضافه کنید.
  • پروژه‌های داستان‌خوانی با صدای بلند ایجاد کنید - نمایش متن را با گفتار ترکیب کنید.
  • ابزارهای یادگیری زبان بسازید - تلفظ، واژگان، عبارات را آموزش دهید.
  • آموزش‌های تعاملی با دستورالعمل‌های گفتاری بسازید.
  • بازی‌ها و آزمون‌های واکنش‌گرا به صدا توسعه دهید.
  • پروژه‌های چندزبانه برای کلاس‌های درس متنوع ایجاد کنید.
  • آموزش صداگذاری شخصیت و نوشتن دیالوگ.
  • پروژه‌های فناوری کمکی برای دانش‌آموزانی که در خواندن مشکل دارند، بسازید.

🎮 پروژه‌های نمونه #

  • کتاب داستان گویا: شخصیت‌ها متن داستان را با صداهای مختلف روایت می‌کنند.
  • معلم زبان: کلمات و عبارات واژگان را به زبان‌های مختلف بیان کنید - با افزونه تشخیص گفتار ترکیب کنید.
  • دستیار صوتی: گربه اسکرچ به عنوان یک دستیار هوش مصنوعی مفید به سوالات پاسخ می‌دهد.
  • خوشامدگوی چندزبانه: بر اساس انتخاب، به کاربران به چندین زبان خوشامد بگویید.
  • بازی مسابقه با سوالات گفتاری: صدا برای دسترسی آسان‌تر، سوالات را با صدای بلند می‌خواند.
  • گفتگوی تعاملی: ایجاد گفتگو بین چندین اسپرایت با صداهای مختلف.
  • اعلان‌های صوتی: از صدا برای اعلام امتیازات، دستاوردها و به‌روزرسانی‌های تایمر استفاده کنید.
  • تمرین تلفظ: کلمه را نمایش دهید، آن را بگویید، از کاربر بخواهید تکرار کند.
  • مکالمات شخصیت‌ها: برای یک شخصیت از صدای زیر، برای شخصیت دیگر از صدای بم و برای شخصیت سوم از صدای کودکانه استفاده کنید.
  • طرح کمدی: از صدای غول برای شخصیت شرور، صدای کودکانه برای قهرمان و صدای بچه گربه‌ای برای شخصیت فرعی استفاده کنید.

🧩 خودتان امتحان کنید: pishi.ai/play

 


🔧 نکات و عیب‌یابی #

 

🔊 نکات ویژه تبدیل متن به گفتار #

  • صدا قطع می‌شود؟ صدای دستگاه و مجوزهای صدای مرورگر خود را بررسی کنید. مطمئن شوید که بلندگوها/هدفون‌ها متصل هستند.
  • گفتار کار نمی‌کند؟ این افزونه نیاز به اتصال به اینترنت دارد - سرویس سنتز مبتنی بر ابر است.
  • تلفظ زبان اشتباه است؟ قبل از صحبت کردن، مطمئن شوید که زبان صحیح را تنظیم کرده‌اید. زبان پیش‌فرض، زبان ویرایشگر است.
  • متن خیلی طولانی است؟ متن را کمتر از ۱۲۸ کاراکتر نگه دارید - متن طولانی‌تر به طور خودکار کوتاه می‌شود.
  • صدا تغییر نمی‌کند؟ قبل از بلوک «بگو»، حتماً از عبارت «صدا ... شود» استفاده کنید.
  • صدای بچه گربه‌ای نامفهوم حرف می‌زند؟ این طبیعی است! صدای بچه گربه برای جلوه دادن شخصیت، تمام کلمات را با «میو» جایگزین می‌کند.
  • آیا در بعضی زبان‌ها گفتار عجیب به نظر می‌رسد؟ بعضی زبان‌ها فقط صدای زنانه دارند - صداهای بم/غول ممکن است به دلیل تنظیم زیر و بمی صدا، غیرمعمول به نظر برسد.
  • می‌خواهید صحبت را زودتر متوقف کنید؟ از دکمه قرمز توقف یا بلوک «توقف همه» استفاده کنید - همه صحبت‌ها فوراً متوقف می‌شوند.
  • چندین اسپرایت در حال صحبت هستند؟ برای ایجاد مکالمه، صداهای مختلفی برای هر اسپرایت تنظیم کنید.
  • همگام‌سازی گفتار با انیمیشن؟ از «بگو» به صورت پشت‌سرهم با تغییر شخصیت، حرکت یا جلوه‌های صوتی استفاده کنید.
  • همپوشانی گفتار؟ بلوک «بگو» منتظر تکمیل می‌ماند - از چندین بلوک «بگو» پشت‌سرهم برای گفتگو استفاده کنید.

💡 نکات خلاقانه #

🎭 شخصیت‌پردازی صدا #

  • راوی: برای روایت واضح و حرفه‌ای از صداهای زیر یا بم استفاده کنید.
  • کودکان/شخصیت‌های کوچک: از صدای کودکانه برای گفتار پرانرژی و با صدای بلند استفاده کنید.
  • شخصیت‌های شرور/بزرگ: از صدای غول برای حضور عمیق و مسلط استفاده کنید.
  • حیوانات/حیوانات خانگی: از صدای بچه گربه‌ای برای شخصیت‌های گربه‌مانند بازیگوش استفاده کنید (همه کلمات به «میو» تبدیل می‌شوند).
  • ربات‌ها/هوش مصنوعی: از صدای زیر یا بم برای واژگان فنی استفاده کنید.
  • موجودات فانتزی: برای صداهای منحصر به فرد شخصیت‌ها، با صدای کودکانه یا غول آزمایش کنید.

📖 تکنیک‌های داستان‌گویی #

  • بلوک‌های «بگو» از اسکرچ را با بلوک‌های «بگو» افزونه ترکیب کنید تا متن را همزمان نمایش داده و بخوانید.
  • برای شخصیت‌های مختلف داستان از صداهای مختلف استفاده کنید.
  • برای ایجاد جلوه‌ای چشمگیر، بین گفتار با استفاده از بلوک‌های «منتظر بمان» مکث کنید.
  • بین صدای راوی (زیر/بم) و صدای شخصیت‌ها (کودکانه/غول) تناوب داشته باشید.
  • از متغیرها برای ذخیره گفتگو و بیان پاسخ‌های پویا استفاده کنید.

🌍 پروژه‌های چندزبانه #

  • ایجاد تغییر زبان با دکمه‌ها یا متغیرها.
  • ترجمه‌ها را در لیست‌ها ذخیره کنید - ترجمه مناسب را بگویید.
  • پروژه‌های «یادگیری زبان» را با تلفظ کلمات بسازید.
  • پروژه‌های تبریک بین‌المللی بسازید - به زبان‌های مختلف «سلام» بگویید.

🔒 حریم خصوصی و امنیت #

  • متن ارسال شده به سیستم سنتز گفتار توسط سرویس ابری اسکرچ (synthesis-service.scratch.mit.edu) پردازش می‌شود.
  • هیچ متنی به طور دائم ذخیره نمی‌شود - فقط برای تولید صدا استفاده می‌شود.
  • صدای تولید شده مستقیماً به مرورگر شما پخش می‌شود - در سرورها ذخیره نمی‌شود.
  • تنظیمات زبان و صدا به صورت محلی در فایل پروژه شما ذخیره می‌شوند.
  • برای عملکرد به اتصال اینترنت نیاز دارد - ترکیب گفتار آفلاین نیست.

🧪 اطلاعات فنی #

  • سرویس سنتز: سرویس تبدیل متن به گفتار مبتنی بر فضای ابری اسکرچ
  • آدرس سرور: synthesis-service.scratch.mit.edu
  • زمان انتظار: ۱۰ ثانیه (درخواست‌های بیش از مهلت، ناموفق خواهند بود)
  • حداکثر طول متن: ۱۲۸ کاراکتر (به طور خودکار کوتاه می‌شود)
  • بلندی صدا: ۲۵۰٪ (برای وضوح بیشتر تقویت شده است)
  • قالب گفتار: بافر صوتی (رمزگشایی و پخش از طریق موتور صوتی اسکرچ)
  • زبان‌های پشتیبانی‌شده: ۲۳ زبان با تلفظ طبیعی
  • صداها: ۵ صدای مجزا با تنظیمات سرعت پخش
  • زبان‌های تک جنسیتی: عربی، چینی، هندی، کره‌ای، نروژی، رومانیایی، سوئدی، ترکی، ولزی
  • نیاز به اینترنت: بله - سرویس سنتز ابری

🆚 نمودار مقایسه صدا #

صدا گام شخصیت بهترین برای
زیر طبیعی حرفه‌ای، واضح راویان، معلمان، گفتار استاندارد
بم طبیعی کمی عمیق‌تر قهرمانان، رهبران، شخصیت‌های با اعتماد به نفس
کودکانه بالا (۳+) بازیگوش، پرانرژی شخصیت‌های کوچک، پری‌ها، کودکان، ربات‌ها
غول پایین (۳-) عمیق، جدی شخصیت‌های بزرگ، تبهکاران، دارای اقتدار
بچه گربه‌ای خیلی بالا (۶+) فوق‌العاده بازیگوش شخصیت‌های گربه‌ای، کمدی (می‌گوید «میو»)

↔ برای مشاهده جدول کامل در موبایل، صفحه را به چپ یا راست بکشید


🔗 افزونه‌های مرتبط #

  • 🎤 تشخیص گفتار - تبدیل صدا به متن (مکمل عالی برای تعاملات صوتی)
  • 🌐 ترجمه - قبل از صحبت کردن، متن را بین زبان‌ها ترجمه کنید
  • 💬 چت جی‌بی‌تی - با هوش مصنوعی گفتگو ایجاد کنید، سپس آن را با متن به گفتار بیان کنید
  • 🎵 موزیک - ترکیب گفتار با موسیقی و جلوه‌های صوتی

📚 اطلاعات بیشتر #


پیمایش به بالا