مخزن دادگان آیپا
ماجراجویی در هوش مصنوعی …
برای مشاهده لیست دادگان از قسمت زیر بازدید فرمایید.
پیکره گفتگوی روزمره گفتا (فیلم و سریال)
این دادگان از ۱۰۰ هزار گفته از فیلم و سریالهای ایرانی تشکیل شدهاست. که اطلاعاتی از قبیل سن و جنسیت و بازه شروع و پایان صحبت و گویندهها را در خود جای داده است.
| تعداد کل کلمات | ۸۴۵۵۲ |
| تعداد گفتهها | ۱۰۰۰۰۰ |
| تعداد دیالوگ | ۸۶۰۲ |
| تعداد دادگان | ۵۰ هزار تصویر |
| ابعاد تصویر | ۱۶۰ پیکسل در ۱۶۰ پیکسل |
| تعداد افراد | ۳۴۰۰ نفر |
| منبع تصویر | وب سایتهای ایرانی |
دادگان تشخیص هویت (افراد مشهور)
این دادگان شامل ۵۰ هزار تصویر از ۳۴۰۰ شخص مشهور در ایران است. این اشخاص شامل افراد مشهور ایرانی و غیر ایرانی هستند که در اخبار فارسی بیشتر مورد توجه قرار گرفته اند.
دادگان تبدیل متن به صوت
این دادگان توسط گروهی از محققین پردازش صوت جمع آوری گردیده است. در این دادگان بیش از ۸۰۰۰ جمله توسط یک گویندهی مرد در استودیو خوانده شده است. منبع این جملات، زیرنویسهای فارسی میباشند.
| تعداد دادگان | ۸ هزار فایل صوتی |
| میانگین طول فایلها | ۸ ثانیه |
| منبع صوت ها | ۳۴۰۰ نفر |
| درخت مکالمه برچسب زده شده | ۳۸۸۹۷ |
| تعداد مکالمه برچسب زده شده | ۱۹۶۵۳۴ |
| تعداد گفته برچسب زده شده | ۷۳۸۴۱۷ |
| تعداد کل کلمات | ۲۶۶۸۹۹۷۳ |
پیکره گفتگوی روزمره گفتا (شبکههای اجتماعی)
این دادگان شامل ۷۳۸۴۱۷ گفته از شبکه های مجازی است که توسط نیروهای خبره با برچسب های ( گفتگوی روزمره ، هدفمندِ جدی ، توهین آمیز ، مشاجره) برچسبگذاری شده است.
فرم درخواست دادگان
پیام خود را برای ما ارسال کنید تا کارشناسان ما در سریعترین زمان با شما تماس بگیرند.
