ভিডিও: पहली बार में कुछ नहीं होता | Sonu Sharma | Best Motivational Video | For association : 7678481813 (নভেম্বর 2024)
এই দিনগুলিতে কম্পিউটিংয়ের সবচেয়ে আলোচিত বিষয় হ'ল মেশিন লার্নিং এবং এটি অবশ্যই হার্ডওয়ারের দিক থেকে দৃশ্যমান। সাম্প্রতিক সপ্তাহগুলিতে, আমরা এনভিডিয়ার টেসলা পি 100 এবং ড্রাইভ পিএক্স 2 থেকে গুগলের টেনসর প্রসেসিং ইউনিট থেকে ইন্টেলের শিওন ফি পর্যন্ত গভীর শিক্ষার জন্য নকশাকৃত নতুন চিপগুলি সম্পর্কে অনেক কিছু শুনেছি। সুতরাং, এটি আশ্চর্যজনক নয় যে হট চিপস সম্মেলনে আমরা গত সপ্তাহে মেশিন লার্নিং এবং ভিশন প্রসেসিংয়ের জন্য ডিজাইনের জন্য বেশ কয়েকটি ভিন্ন পদ্ধতির সাথে বিভিন্ন সংস্থার কাছ থেকে শুনেছি।
সম্ভবত সবচেয়ে বড় খবরটি ছিল এনভিডিয়ায় তার পার্কার চিপ সম্পর্কিত আরও বিশদ প্রকাশ, এটি গাড়ি চালনার গাড়িগুলির জন্য তার ড্রাইভ পিএক্স 2 মডিউলে ব্যবহৃত হয়েছিল এবং স্বায়ত্তশাসিত মেশিনগুলির গভীর শিক্ষার উদ্দেশ্যে ছিল। এই চিপটিতে দুটি কাস্টম বিল্ট এআরএম-সামঞ্জস্যপূর্ণ ডেনভার সিপিইউ কোর, চারটি এআরএম কর্টেক্স-এ 57 কোর এবং 256 এনভিডিয়া পাস্কাল সিউডিএ (গ্রাফিক্স) কোরকে কী বোঝায় uses
এনভিডিয়া বলেছিলেন যে এটি স্বয়ংচালিত ব্যবহারের জন্য নকশাকৃত এবং রেটযুক্ত, এটির প্রথম দৃ res় যা বিশেষ অনিচ্ছাকৃত বৈশিষ্ট্য সহ, এবং তার দ্রুত গতি এবং স্মৃতিশক্তি নিয়ে কথা বলেছিল, উল্লেখ করে যে ডেনভার কোর ওয়াট প্রতি পারফরম্যান্সে উল্লেখযোগ্য উন্নতি সরবরাহ করে। নতুন বৈশিষ্ট্যগুলির মধ্যে রয়েছে হার্ডওয়্যার-অ্যাসিস্টেড ভার্চুয়ালাইজেশন, featuresতিহ্যগতভাবে পৃথক কম্পিউটারে করা গাড়ি বৈশিষ্ট্যগুলির একীকরণ সক্ষম করতে 8 টি ভিএমএস সহ। সামগ্রিকভাবে, সংস্থাটি বলেছে যে ড্রাইভ পিএক্স 2 মডেলটিতে 8 টি টেরালফ্লপস (ডাবল যথার্থতা) বা 24 ডিপ লার্নিং অপারেশনস (8-বিট, বা অর্ধ-নির্ভুলতা) সহ মোট পারফরম্যান্স সহ এই দুটি পার্কার চিপ এবং দুটি স্বতন্ত্র জিপিইউ থাকতে পারে The অপেক্ষাকৃত পুরাতন মানদণ্ড, স্পেশেন্ট ৩০০০ ব্যবহার করে বর্তমান মোবাইল প্রসেসিংয়ের বিরুদ্ধে অনুকূলভাবে তুলনা করা বেঞ্চমার্ক অন্তর্ভুক্ত করেছে। তবে অভিনয়টি চিত্তাকর্ষক বলে মনে হচ্ছে এবং ভলভো সম্প্রতি বলেছে যে এটি এটি পরের বছর থেকে শুরু হওয়া স্বায়ত্তশাসিত যানবাহন পরীক্ষা করতে ব্যবহার করবে।
অবশ্যই, অনেক অন্যান্য পন্থা আছে।
চাইনিজ স্টার্টআপ ডিফি নিউরাল নেটওয়ার্কগুলির জন্য একটি এফপিজিএ-ভিত্তিক প্ল্যাটফর্ম নিয়ে আলোচনা করেছেন, যার মধ্যে নেটওয়ার্কের ধরণের উপর নির্ভর করে দুটি ভিন্ন আর্কিটেকচার রয়েছে। অ্যারিস্টটল তুলনামূলকভাবে ছোট কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলির জন্য ডিজাইন করা হয়েছে এবং জিলিনেক্স জিনক 000০০০ এর উপর ভিত্তি করে তৈরি করা হয়েছে, যখন ডেসকার্টস দীর্ঘ সংক্ষিপ্ত-মেয়াদী মেমরি (আরএনএন-এলএসটিএম) ব্যবহার করে কিনটেক্স আল্ট্রাস্কেল এফপিজিএর ভিত্তিতে বৃহত্তর পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলির জন্য ডিজাইন করা হয়েছে। ডিফি দাবি করেছেন যে এর সংকলক এবং আর্কিটেকচারটি বেশিরভাগ এফপিজিএর তুলনায় উন্নয়নের সময় কেটেছে এবং এফপিজিএ ব্যবহার করা এনভিডিয়ার টেগ্রা কে 1 এবং কে 40 সমাধানের চেয়ে আরও ভাল পারফরম্যান্স সরবরাহ করতে পারে।
আর একটি পদ্ধতি হ'ল ডিজিটাল সিগন্যাল প্রসেসর বা ডিএসপি ব্যবহার করা, যা সাধারণত খুব অল্প শক্তি ব্যবহার করে খুব দ্রুত একটি নির্দিষ্ট ফাংশন বা একটি ছোট্ট ফাংশন সম্পাদন করে। প্রায়শই এগুলি অন্যান্য, আরও জটিল চিপগুলিতে এম্বেড করা হয় কিছু নির্দিষ্ট কাজগুলি যেমন ভিশন প্রক্রিয়াজাতকরণের গতি বাড়ানোর জন্য। মুভিডিয়াস, সিইভিএ এবং ক্যাডেন্স সহ বেশ কয়েকটি সংস্থা হট চিপসে তাদের সমাধানগুলি ভাগ করে নিচ্ছিল।
মুভিডিয়াস তার ডিএসপি-ভিত্তিক সমাধানটি মরিয়াড 2 ভিশন প্রসেসিং ইউনিট হিসাবে পরিচিত দেখিয়েছিল এবং এটি ডিজেআই ফ্যান্টম 4 ড্রোনটিতে প্রদর্শন করেছিল। এটি আরও দেখিয়েছিল যে মরিয়াদ 2 কীভাবে জিপিইউ এবং গুগলনেট গভীর নিউরাল নেটওয়ার্ককে 2014 ইমেজনেট প্রতিযোগিতায় ব্যবহার করেছে per
সিইভিএ তার সিইভিএ-এক্সএম 4 ভিশন ডিএসপিকে প্রচার করছে, বিশেষত ভিশন প্রসেসিংয়ের জন্য সুরযুক্ত এবং এর সিইভিএ ডিপ নিউরাল নেটওয়ার্ক 2 প্ল্যাটফর্মের সাথে মোটরগাড়ি বাজারের দিকে লক্ষ্য রেখেছিল, যা বলেছিল যে ক্যাফে বা টেনসরফ্লো ফ্রেমওয়ার্কের জন্য লিখিত কিছু গ্রহণ করতে পারে এবং এটি চালনার জন্য অনুকূলিত করতে পারে এর ডিএসপিতে নতুন প্রসেসরটি পরের বছর SoC- তে থাকা উচিত।
এদিকে, ক্যাডেন্স, যা টেনসিলিকা পরিবারকে ভিশন প্রসেসরের (যা অন্যান্য পণ্যগুলিতে এম্বেড করা যেতে পারে) তৈরি করে, তার নতুন সংস্করণ, ভিশন পি 6 নিয়ে আলোচনা করেছে, যা ভেক্টর ফ্লোটিং-পয়েন্ট সমর্থন এবং কনভোলশনাল নিউরাল নেটওয়ার্কগুলির জন্য অন্যান্য বৈশিষ্ট্যগুলির মতো নতুন বৈশিষ্ট্য যুক্ত করেছে । প্রথম পণ্যগুলি শীঘ্রই বাইরে বের হওয়া উচিত।
মাইক্রোসফ্ট তার হলোলেন্স হেডসেটের জন্য হার্ডওয়্যার সম্পর্কিত বিশদ সম্পর্কে কথা বলেছে, এটি একটি 14nm ইনটেল অ্যাটম চেরি ট্রেল প্রসেসর উইন্ডোজ 10 চালিত এবং একটি কাস্টম হলোগ্রাফিক প্রসেসিং ইউনিট (এইচপিইউ 1.0) সেন্সর হাব ব্যবহার করেছে, টিএসএমসি দ্বারা নির্মিত 28nm প্রক্রিয়াতে। এর মধ্যে 24 টেনসিলিকা ডিএসপি কোর অন্তর্ভুক্ত রয়েছে।
আমি বিশেষত ক্যাডেন্সের একটি স্লাইড নিয়েছি যা জিপিইউ, এফপিজিএ এবং বিভিন্ন ধরণের ডিএসপি'র থ্রিপুট এবং দক্ষতার মধ্যে পার্থক্য দেখিয়েছিল, নিউরাল নেটওয়ার্কগুলির অন্যতম মূল বিল্ডিং ব্লক ly স্পষ্টত স্ব-পরিবেশন করার সময় (সমস্ত বিক্রেতাদের উপস্থাপনা যেমন রয়েছে), এটি কীভাবে গতি এবং দক্ষতার ক্ষেত্রে ওয়াট প্রতি পারফরম্যান্সের ক্ষেত্রে বিভিন্ন কৌশল পরিবর্তিত হয় তা উল্লেখ করে না, প্রোগ্রামিংয়ের ব্যয় এবং স্বাচ্ছন্দ্যের কথা উল্লেখ না করে। এখানে বিভিন্ন পদ্ধতির জন্য অনেকগুলি সমাধান রয়েছে এবং পরবর্তী কয়েক বছরে এটি কীভাবে কাঁপছে তা দেখতে আকর্ষণীয় হবে।