সুচিপত্র:
- কীভাবে গভীর শিক্ষণ মানব কণ্ঠ উত্পন্ন করে
- একটি নির্বোধ ব্যক্তির ভয়েস পুনরুদ্ধার করা
- এআই সিনথেসাইজারগুলির নেতিবাচক ব্যবহারগুলিকে ভারসাম্যপূর্ণ করা
ভিডিও: BITTEN by a VAMPIRE FISH! (নভেম্বর 2024)
2017 সালে, অ্যামিওট্রফিক ল্যাট্রাল স্ক্লেরোসিস (এএলএস), একটি বিধ্বংসী নিউরোলজিকাল ব্যাধি, বিখ্যাত আইস বালতি চ্যালেঞ্জের প্রতিষ্ঠাতা প্যাট কুইনকে তার কথা বলার ক্ষমতা ছিনিয়ে নিয়েছিল।
মেশিন লার্নিং এবং গভীর শিক্ষার অগ্রগতির জন্য ধন্যবাদ, কৃত্রিম বুদ্ধিমত্তা অ্যালগরিদমগুলি মানুষের অনুকরণে খুব ভাল হয়ে উঠেছে। তবে মহাকাশে অনেকগুলি গুরুত্বপূর্ণ বিকাশ নেতিবাচক হলেও, এআইয়ের অনুকরণ শক্তি কুইনের জন্য ইতিবাচক পরিবর্তনের একটি শক্তি ছিল।
কুইনের মতো এএলএস রোগীদের সহায়তার লক্ষ্যে প্রজেক্ট রিভয়েস এর কফাউন্ডার ওসকার ওয়েস্টারডাল বলেছেন, "আ.ল.এস. (বেশিরভাগ মোটর নিউরোন ডিজিজ নামে পরিচিত) জনগণের মধ্যে পক্ষাঘাতগ্রস্থ হয়ে পড়ে এবং কৃত্রিম 'কম্পিউটার' ভয়েস ছাড়া আর কোনও কিছুতে যোগাযোগ করতে অক্ষম হয়, " ।
কুইনের ভয়েসটি পুনরায় তৈরি করতে, প্রকল্প রিভয়েস লাইয়ারবার্ডের সাথে একত্রিত হয়ে, একটি মুষ্টিমেয় সংস্থাগুলি যে একজন ব্যক্তির ভয়েস ক্লোন করতে এআই ব্যবহার করে - এমন একটি গ্রুপ যা গুগলের ওয়েভনেট এবং ভোসারি, একটি ওয়াই কম্বিনেটর-সমর্থিত স্টার্টআপ যা সংশ্লেষিত ভয়েস রেকর্ডিং তৈরি করতে এআই ব্যবহার করে ।
কীভাবে গভীর শিক্ষণ মানব কণ্ঠ উত্পন্ন করে
এই অ্যাপ্লিকেশনগুলির পিছনে গভীর-শেখার অ্যালগরিদম রয়েছে, এআইয়ের একটি জনপ্রিয় শাখা যা অন্তর্দৃষ্টি এবং নিদর্শনগুলির জন্য প্রচুর পরিমাণে ডেটা ব্যবহার করে যা traditionalতিহ্যগত, নিয়ম-ভিত্তিক সফ্টওয়্যার দ্বারা ক্যাপচার করা যায় না। আপনি যখন ভয়েস রেকর্ডিংয়ের সাথে গভীর-শেখার ভয়েস সিন্থেসাইজারকে প্রশিক্ষণ দেন, তখন এটি একটি ডিজিটাল মডেল তৈরি করে যা ব্যক্তির কণ্ঠকে উপস্থাপন করে এবং নতুন ভয়েস নমুনা তৈরি করতে পারে।
এআই-চালিত ভয়েস সংশ্লেষ প্রযুক্তিটি আবিষ্কারের আগে, এএলএস রোগীদের জেনেরিক ডিজিটাল ভয়েসগুলি ব্যবহার করতে হয়েছিল যা তাদের নিজস্ব ছিল না। অন্যান্য প্রযুক্তিগুলি রোগীর ভয়েসের সাথে প্রাক-রেকর্ডকৃত বাক্যগুলি একসাথে সেলাই করতে পারে তবে ফলাফলগুলি খুব কৃত্রিম ছিল এবং কয়েক ঘন্টার ভয়েস রেকর্ডিংয়ের স্বল্প ব্যবহারের প্রয়োজন ছিল।
ডিপ-লার্নিং অ্যাপ্লিকেশনগুলি, অন্যদিকে, অনেক কম ডেটা প্রয়োজন এবং আরও ভাল ফলাফল সরবরাহ করে। ওয়েস্টারডাল বলেছেন, "মাত্র কয়েক ঘন্টা অডিওর মাধ্যমে লিরবার্ড যা অর্জন করতে পারে তা লক্ষণীয় - এটি মানুষকে একটি সম্পূর্ণ ডিজিটাল ভয়েস ক্লোন দেয়, তাই তারা যা খুশি তা বলতে পারে, " ওয়েস্টারডাল বলে।
একটি নির্বোধ ব্যক্তির ভয়েস পুনরুদ্ধার করা
গভীর-শিক্ষার অ্যাপ্লিকেশনগুলির সীমাগুলির মধ্যে একটি হ'ল তাদের নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণের জন্য উচ্চ-মানের ডেটা নমুনাগুলির উপর নির্ভরতা। এএলএস রোগীদের সমস্যা হ'ল একবার তারা স্বর হারিয়ে ফেললে ভয়েসের নমুনাগুলি রেকর্ড করা অসম্ভব। ভাগ্যক্রমে, কুইনের কয়েক ঘন্টা রেকর্ড করা মূল নোট এবং সাক্ষাত্কার ছিল।
"সবচেয়ে বড় চ্যালেঞ্জটি ছিল গুণমান। এই প্রযুক্তিটি সম্পূর্ণরূপে সুসংগত, উচ্চ-মানের রেকর্ডিংয়ের উপর নির্ভরশীল যা সঠিক স্ক্রিপ্টটি অনুসরণ করে - তাই আমাদের হাতে 'রিমাস্টার' করার জন্য একটি সাউন্ড স্টুডিওর সাথে কাজ করতে হয়েছিল এবং আমরা যে সংলাপটি খুঁজে পেতাম তার প্রতিটি লাইন প্রতিলিপি করতে হয়েছিল। প্যাট এর, "ওয়েস্টারডাল বলেছেন।
"আমরা কিছুটা ভয় পেয়েছি যে প্যাটসের কণ্ঠস্বর তৈরি করার জন্য আমরা একটি দুর্দান্ত মানের সরবরাহ করতে সক্ষম হব না, " লিয়ারবার্ডের কফাউন্ডার হোসে সোটেলো বলেছেন। "যেহেতু আমরা পরিষ্কার রেকর্ডিং পেতে পারি না, কৃত্রিম কণ্ঠের চূড়ান্ত গুণটি সঠিক নয় We আমরা মনে করি আমরা পরিষ্কার রেকর্ডিংয়ের মাধ্যমে আরও অনেক ভাল কাজ করতে পারি""
ফলাফলগুলি এখনও কিছুটা অপ্রাকৃত এবং সিন্থেটিক শোনায়। তবে কুইন, যিনি যোগাযোগের জন্য জেনেরিক ভয়েস ব্যবহার করেছিলেন, তাদের মধ্যে পার্থক্য ছিল নাটকীয়। "এই নতুন প্রযুক্তির মাধ্যমে আমার ভয়েস শোনার পরে, আমি উড়ে গেলাম! আএলএস দূরে সরিয়ে নেওয়ার পরে রোগীদের জানার জন্য তারা তাদের নিজস্ব ভয়েস রাখতে পারে, এটি ALS এর সাথে মানুষের জীবনযাত্রার পরিবর্তনে পরিবর্তন আনবে।"
কুইন সুপারিশ করে যে ALS রোগীরা খুব দেরী হওয়ার আগে তাদের ভয়েস রেকর্ড করে। "আমার নিজের ভয়েস আবার শুনার পরে, আমি ALS রোগীদের তাদের ভয়েস রেকর্ডিং অবিশ্বাস্যভাবে গুরুত্বপূর্ণ জেনে রাখা উচিত, " তিনি বলেছেন।
এআই সিনথেসাইজারগুলির নেতিবাচক ব্যবহারগুলিকে ভারসাম্যপূর্ণ করা
এই বছরের শুরুর দিকে, ফ্যাক অ্যাপ, একটি এআই-চালিত ফেস-অদলবদ অ্যাপ্লিকেশন, সেলিব্রিটি এবং রাজনীতিবিদদের সমন্বিত জাল অশ্লীল ভিডিওগুলির একটি আক্রমণ চালিয়েছিল। উদ্বেগ রয়েছে যে ফেক অ্যাপ এবং লিরবার্ডের মতো অ্যাপ্লিকেশনগুলি জাল খবর, জালিয়াতি এবং জালিয়াতির নতুন যুগে সূচনা করবে।
লিরবার্ডের ওয়েবসাইটে নীতিশাস্ত্রের পৃষ্ঠাটি আগে স্বীকার করে নিয়েছিল যে প্রযুক্তিটি সম্ভবত "কূটনীতিককে বিভ্রান্ত করা, জালিয়াতি এবং সাধারণত অন্য কারও পরিচয় চুরি করার কারণে সৃষ্ট অন্য যে কোনও সমস্যা হতে পারে এমন বিপজ্জনক পরিণতি হতে পারে।"
বিষয়টিকে চালিত করার জন্য, সংস্থার ওয়েবসাইটে ডোনাল্ড ট্রাম্প এবং বারাক ওবামার কণ্ঠে তৈরি করা বেশ কয়েকটি সংশ্লেষিত রেকর্ডিং রয়েছে।
@ রিয়ালডোনাল্ডট্রম্প https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk
- লাইরেবার্ড এআই (@ লায়ারবার্ডআই) সেপ্টেম্বর 4, 2017
কুইনের গল্প সম্ভবত এমন একটি শিল্পের ইতিবাচক দিকগুলিতে আলোকপাত করতে সহায়তা করবে যা এর প্রয়োগগুলির সম্ভাব্য ভয়ঙ্কর এবং অনৈতিক ব্যবহারের পক্ষে ঝাঁকুনি নিয়েছে। "এটি গুরুত্বপূর্ণ যে লোকেরা এই প্রযুক্তির উজ্জ্বল দিকটি অনুধাবন করতে পারে, " লিয়ারবার্ডের সোটেলো মনে করিয়ে দেয়।
চিকিত্সা ব্যবহার বাদে, এআই সিন্থেসাইজার অ্যাপ্লিকেশনগুলি অন্যান্য উত্পাদনশীল লক্ষ্যগুলি পরিবেশন করতে পারে। ভোচারি এআই অ্যালগরিদম দ্বারা চালিত কাস্টমাইজড ডিজিটালাইজড ভয়েস সহ ব্র্যান্ড সরবরাহ করছে। গুগল তার গুগল অ্যাসিস্ট্যান্ট। চালিত ডিভাইসগুলির ব্যবহারকারীদের আরও প্রাকৃতিক অভিজ্ঞতা সরবরাহ করতে ওয়েভনেট নিয়েও পরীক্ষা করছে। প্রযুক্তিটি কার্যকর এমন অন্যান্য ক্ষেত্রগুলির মধ্যে রয়েছে অডিওবুকগুলি স্বয়ংক্রিয় করা বা ফিল্মগুলিতে ভয়েস ডাবিং করা আরও সহজ।
নৈতিক ও আইনী বাধা নিঃসন্দেহে উত্থিত হবে এবং বিতর্ক অব্যাহত থাকবে। তবে কুইনের জন্য, এআই ভাল করার জন্য একটি শক্তি। "আমি কম্পিউটারের মতো শব্দ করতে চাই না, " তিনি বলেছেন। "আমি আমার মতো শব্দ করতে চাই।"