সুচিপত্র:
- 1. লজিস্টিক ভুলবেন না
- 2. আপনার ডেটা মনে
- ৩. অ্যালগরিদমগুলি ম্যাজিক বুলেট নয়
- ৪. একটি বিবিধ টুলসেট ব্যবহার করুন
- 5. হাইব্রিড লার্নিংয়ের সাথে পরীক্ষা করুন
- Cheap. সস্তা সস্তা মানে খারাপ নয়
- 7. এটি এআই কল করবেন না
ভিডিও: ये कà¥?या है जानकार आपके à¤à¥€ पसीने छà¥?ट ज (নভেম্বর 2024)
আমাদের বিজনেস গাইড টু মেশিন লার্নিংয়ের (এমএল) প্রথম অংশটি ভেঙে গেছে যে কীভাবে এমএল-এর ছাতা ধারণাটি ব্যবসায়ের পরিবেশে আরও বেশি প্রয়োজনীয়। সবচেয়ে কার্যকর কৌশলগুলি এমএলকে ব্যবহারিক অর্থে দেখায়, এন্টারপ্রাইজ প্রক্রিয়াগুলিকে অনুকূল করতে এবং বাস্তব ব্যবসায়ের বুদ্ধি (বিআই) অন্তর্দৃষ্টি অর্জনের জন্য জটিল গভীর শিক্ষা এবং কম-নিবিড় "সস্তা শেখার" কৌশল উভয়ই নিয়োগ করে।
আপনার ব্যবসায়িক অ্যাপ্লিকেশনগুলির মধ্যে এমএল মোতায়েনের লক্ষ্য হ'ল আপনার নীচের লাইনটি উন্নতি করা বা আপনার সংস্থার প্রতিযোগিতামূলক সুবিধা টিপুন। তবে আপনার সংস্থার বৃহত্তর স্কিমে, আপনি এই প্রক্রিয়াটিতে যে পরিমাণ সময় এবং সংস্থান বিনিয়োগ করেন তার সর্বাধিক অর্থায়নটি অ্যালগরিদমের বাইরে চলে যায়। আপনার ব্যবসায়ের আইটি সিদ্ধান্ত নির্ধারকদের আপনার এমএল অভিবাসনে ফ্যাক্টরিং - ডেটা এবং লজিস্টিক থেকে আপনি কীভাবে ব্যবহারকারীদের সাথে নিযুক্ত রয়েছেন তা নির্ধারণ করা দরকার - কার্যকারিতা সর্বাধিকীকরণের জন্য একত্রে একসাথে কাজ করে।
টেড ডানিং, পিএইচডি, ম্যাপআর-এর চিফ অ্যাপ্লিকেশন আর্কিটেক্ট যা বিভিন্ন বিগ ডেটা বিতরণ এবং ডেটা ম্যানেজমেন্ট সরঞ্জাম সরবরাহ করে এমন একটি এন্টারপ্রাইজ সফ্টওয়্যার সংস্থা। ডানিং "প্র্যাকটিকাল মেশিন লার্নিং" হিসাবে যা উল্লেখ করেছেন তার উপর দুটি বই সহ-রচনা করেছেন এবং আইডি অ্যানালিটিক্স জালিয়াতি সনাক্তকরণ সিস্টেম (লাইফলক দ্বারা কেনা) এবং মিউজিকম্যাচ জুকবক্স সফ্টওয়্যার সহ কয়েক বছর ধরে বেশ কয়েকটি সংস্থার জন্য এমএল প্রযুক্তি বিকাশ করেছেন, যা পরে ইয়াহু সংগীতে পরিণত হয়েছিল। বর্তমানে তিনি অ্যাপাচি সফটওয়্যার ফাউন্ডেশনের ইনকিউবেশন-এর ভাইস প্রেসিডেন্ট হিসাবেও দায়িত্ব পালন করছেন।
ডানিং কয়েক দশক ধরে এমএল স্পেসটি বিকশিত হয়ে দেখেছেন এবং ব্যবহারিক ব্যবসায়ের পরিবেশে কী কাজ করে এবং কী না তা সম্পর্কে অনেক কিছু শিখেছে। নীচে, ডানিং এমএল-এ মূলযুক্ত ব্যবসায়ের সমাধানগুলি বিকাশ করার সময় অনুসরণ করার জন্য সাতটি সেরা অনুশীলন রাখে।
1. লজিস্টিক ভুলবেন না
সফল এমএল কেবল সঠিক সরঞ্জাম বা অ্যালগরিদম বেছে নেওয়ার বিষয়ে নয়। ডানিং বলেছিলেন যে কোন পদ্ধতির পক্ষে উপযুক্ত তা আপনার পক্ষেও ঠিক করা উচিত এবং আপনি যে নির্দিষ্ট পরিস্থিতিতে সম্বোধন করছেন তার জন্য এটির নকশা তৈরি করতে হবে। উদাহরণস্বরূপ, ডানিং একটি অনলাইন বিপণন প্রচারে এমএল সম্পর্কে কথা বলেছিলেন যেমন স্বায়ত্তশাসিত গাড়ি পরিচালিত অ্যালগরিদমের মতো আরও জটিল পরিস্থিতিতে। আপনার ক্রমবর্ধমান অ্যালগরিদম উন্নতির জন্য আপনার সংস্থান ব্যয় করা গাড়ির জন্য ঝামেলার উপযুক্ত, তবে বিপণনের দৃশ্যে, আপনি তার চারপাশের সমস্ত লজিস্টিককে অনুকূল করে তোলার চেয়ে আরও ভাল প্রত্যাবর্তন দেখতে পাবেন।
"ব্যবসায়ের জন্য প্রায়শই এটি রসদ নয়, শেখা নয়, যা আপনাকে মূল্য দেয় That's এই অংশটি আপনার নিজের সময় এবং সংস্থান ব্যয় করা উচিত, " ডানিং বলেছিলেন। "অ্যালগরিদম সামঞ্জস্য করা আপনাকে সামান্য উন্নতি করতে পারে But তবে সেই তথ্যটি, জিইউআই এবং আপনার ব্যবহারকারীদের সাথে কীভাবে শুনছেন এবং নিযুক্ত থাকবেন তা সামঞ্জস্য করা আপনাকে সহজেই শতভাগ উন্নতি দিতে পারে। অ্যালগরিদমকে টুইট করার জন্য সময় ব্যয় করা যেমন ভগ্নাংশ হিসাবে মূল্যহীন আপনার ব্যবহারকারীদের যেমন শুনছেন তেমন ব্যবসায়ের পক্ষেও অনেক কিছু।"
এই বিষয়টিকে উদাহরণস্বরূপ বর্ণনা করার জন্য, ডানিং ব্যাখ্যা করেছিলেন যে তিনি কীভাবে একবার কোনও সংস্থার গ্রাহক ডাটাবেসে অ্যাপ্লিকেশন জালিয়াতি (চুরির পরিচয় দিয়ে জাল অ্যাকাউন্ট খুলতে) সনাক্ত করার জন্য একটি মডেল তৈরি করেছিলেন। তিনি যে মডেলটি তৈরি করেছিলেন তা দুর্দান্ত ফলাফল পেয়েছে, তবে ডানিং লক্ষ্য করেছেন যে এটি আবেদনকারীর লিঙ্গকে খুব ভারী করে তুলেছে।
দেখা গেল লজিস্টিক বন্ধ ছিল। আবেদন প্রক্রিয়াটি যেভাবে কাজ করেছে, আবেদনকারী ইতিমধ্যে গ্রাহক হওয়ার পরে এবং জালিয়াতিদের ফিল্টার আউট করার জন্য বেশ কয়েকটি স্ক্রিনিং পদক্ষেপগুলি পেরিয়ে যাওয়ার পরে কেবল তাদের লিঙ্গ পূরণ করেছিল। সুতরাং লিঙ্গ ক্ষেত্রটি ব্যবহার করে, এমএল মডেল পুরো জালিয়াতি প্রক্রিয়াটির রসদ প্রতারণা করছে। অ্যালগরিদমের সাথে এর কোনও যোগসূত্র নেই, এবং সংস্থাটি কীভাবে তার ডেটা প্রথম স্থানে নিয়ে আসছিল তার সাথে করণীয়।
2. আপনার ডেটা মনে
ডানিং জ্ঞানের আকর্ষণীয় জোয়ারে পূর্ণ। "এটি রসদ নয়, শিখন নয়" দিয়ে শুরু করার পরে তিনি বলেছিলেন যে এই ধারণার অন্যান্য অর্ধেকটি "এটি ডেটা, অ্যালগোরিদম নয়।" আপনার এমএল অ্যালগরিদমগুলি মূল্যবান অন্তর্দৃষ্টি সরবরাহ করছে তা নিশ্চিত করার একটি বড় অংশ নিশ্চিত করে নিচ্ছে যে আপনি তাদের সঠিক ডেটা খাচ্ছেন। ডানিং বলেছিল, আপনি যে ফলাফলটির জন্য সন্ধান করছেন তা যদি না পেয়ে থাকেন তবে তার চেয়ে বেশি বার না কারণ আপনি সঠিক ডেটা ব্যবহার করছেন না।
ডানিং বলেছেন, "লোকেরা সমস্ত ক্ষতবিক্ষত হয়ে ওঠে এবং নির্দিষ্ট অ্যালগোরিদমে অহংকারে আবদ্ধ থাকে, তবে আজকাল, সেখানে সরঞ্জামগুলির কারণে, সবাই এবং তাদের মা পারে এবং সব ধরণের নতুন অ্যালগরিদম নিয়ে আসতে পারে, " ডানিং বলেছিলেন। "ডেটা আরও গুরুত্বপূর্ণ, এবং আপনাকে অ্যালগরিদমগুলি অবিচ্ছিন্নভাবে টুইট করার চেয়ে অনেক বেশি উত্তোলন দেবে you're আপনি যদি বক্তৃতার স্বীকৃতি বা কম্পিউটার ভিশনের মতো কোনও সমস্যা নিয়ে কাজ করছেন তবে এটি একটি জিনিস But তবে এটি একটি ডেটা চালিত ক্ষেত্র। সংখ্যাগরিষ্ঠ পরিস্থিতিতে আপনি কী ডেটা পাচ্ছেন তা সামঞ্জস্য করে এবং প্রশ্নটি পরিবর্তন করে আপনি অনেক বেশি উপকৃত হবেন।"
2000-এর দশকের মাঝামাঝি তেওহ নেটওয়ার্কস নামে একটি সংস্থায় ভিডিও প্রস্তাবনা ইঞ্জিন তৈরি করার সময় ডানিং এটি করেছিলেন। দলটি ব্যবহারকারী-উত্পাদিত ভিডিওগুলির জোড়া সনাক্ত করতে কাজ করছে যা লোকেরা প্রত্যাশার চেয়ে বেশি ক্লিক করেছে, তবে অ্যালগরিদম কাজ করছে না। তারা সংগীতের ক্ষেত্রে চিন্তাভাবনা করছিলেন, যেখানে ব্যবহারকারীরা তাদের প্রিয় শিল্পী এবং গানগুলিকে নামেই জানেন। সুতরাং তারা অ্যালগোরিদম নিজেই স্পর্শ না করেই ইউজার ইন্টারফেস টুইট করে প্রশ্নটি পরিবর্তন করে।
"ব্যবহারকারীরা উত্পাদিত ভিডিওগুলিতে, শিল্পীরা এবং প্রচুর ভিডিওর আরও বেশি ধারণা পাওয়ার জন্য সত্যই স্প্যামি শিরোনামগুলি জানত না know অ্যালগরিদম টুইটগুলিতে সাইকেল চালানো আমাদের কখনও ভাল ফলাফল দিতে পারত না, " ডানিং বলেছিলেন। "আমরা যা করেছি তা প্রতি 10 সেকেন্ডে একটি বীকন সিগন্যাল নির্গমন করতে ব্যবহারকারীর ইন্টারফেসটি পরিবর্তন করা হয়েছিল We আমরা দেখেছি যে আমরা যদি প্রস্তাবকের কাঁচা ডেটার জন্য ক্লিকের পরিবর্তে বীকন ব্যবহার করি, তবে আমরা দুর্দান্ত ফলাফল পেয়েছি this এই পরিবর্তনের জন্য লিফট বেশ কয়েকটি ছিল কোনও অ্যালগরিদমিক পরিবর্তন না করে সুপারিশের কারণে ব্যস্ততায় শতভাগ উন্নতি হয়েছে।"
৩. অ্যালগরিদমগুলি ম্যাজিক বুলেট নয়
এমএল বাস্তবায়ন ক্রমাগত পরীক্ষা এবং ত্রুটিতে সাফল্য লাভ করে। আপনার অ্যালগরিদমগুলি কতটা ভাল তা বিবেচনা না করেই যদি আপনার সিস্টেমটি মানুষের সাথে যোগাযোগ করে তবে সময়ের সাথে সাথে এটি সমন্বয় করা প্রয়োজন to ডানিং জোর দিয়েছিলেন যে ব্যবসায়ের ক্রমাগত তাদের বাস্তবায়নের সামগ্রিক কার্যকারিতা পরিমাপ করা উচিত এবং পরিবর্তন এবং ভেরিয়েবলগুলি চিহ্নিত করা উচিত যা এটি আরও ভাল করে তুলছে এবং আরও খারাপ করে তুলছে। এটি একটি অবজ্ঞার মতো শোনাতে পারে তবে ডানিং বলেছিলেন, এটি যতটা স্পষ্ট মনে হচ্ছে তবু খুব কম লোকই এটি করছে বা এটি ভাল করছে।
"প্রচুর মানুষ একটি সিস্টেম স্থাপন করতে বা কিছু পদক্ষেপ নিতে চায় এবং তারা চায় যে তাদের অ্যালগোরিদম চিরকাল পুরোপুরি চলুক, " ডানিং বলেছেন। "কোনও অ্যালগোরিদম ম্যাজিক বুলেট হতে চলেছে না No কোনও ইউজার ইন্টারফেস ডিজাইন চিরকাল স্থায়ী হবে না data সিস্টেম কাজ করে।"
৪. একটি বিবিধ টুলসেট ব্যবহার করুন
এখানে কয়েক ডজন এমএল সরঞ্জাম উপলব্ধ রয়েছে যার মধ্যে অনেকগুলি আপনি নিখরচায় ব্যবহার করতে পারেন। আপনি মাহফট, সিঙ্গা এবং স্পার্ক সহ বেশ কয়েকটি অ্যাপাচি সফটওয়্যার ফাউন্ডেশন (এএসএফ) প্রকল্পগুলিতে ক্যাফ, এইচ 20, শোগুন, টেনসরফ্লো এবং টর্চের মতো জনপ্রিয় ওপেন সোর্স ফ্রেমওয়ার্ক লাইব্রেরি পেয়েছেন। তারপরে অ্যামাজন মেশিন লার্নিং, বিগএমএল এবং মাইক্রোসফ্ট অ্যাজুরি মেশিন লার্নিং স্টুডিও সহ সাবস্ক্রিপশন-ভিত্তিক বিকল্প রয়েছে। মাইক্রোসফ্টে একটি ফ্রি কগনিটিভ টুলকিট রয়েছে।
অগণিত সংস্থান আছে। ডানিং অসংখ্য ব্যবসায়, তথ্য বিজ্ঞানী এবং এমএল অনুশীলনকারীদের সাথে কথা বলেছে এবং সর্বদা তাদের জিজ্ঞাসা করে যে তারা কতগুলি আলাদা ফ্রেমওয়ার্ক এবং সরঞ্জাম ব্যবহার করেন। গড়ে, ডানিং বেশিরভাগ বলেছিলেন যে তারা সর্বনিম্ন 5-7 টি সরঞ্জাম ব্যবহার করে এবং প্রায়শই অনেক বেশি।
"আপনি একটি সরঞ্জামে আঠালো হয়ে উঠতে পারবেন না You're আপনাকে বেশ কয়েকটি ব্যবহার করতে হবে এবং এর মতো, আপনি আপনার সিস্টেমটি এমনভাবে তৈরি করতে চান যা এটি অজ্ঞাত জ্ঞাত, " "যে কেউ আপনাকে বোঝাতে চেষ্টা করে যে এই সরঞ্জামটি কেবলমাত্র আপনার প্রয়োজন হবে তিনি আপনাকে একটি বিলের পণ্য বিক্রি করে দিচ্ছেন।
"পরের সপ্তাহে এমন কিছু ঘটতে পারে যা আপেল কার্টকে উত্সাহিত করে, এবং আমরা যে উদ্ভাবনের হার দেখছি, এটি কমপক্ষে আরও পাঁচ থেকে 10 বছর ধরে চলতে থাকবে, " ডানিং বলেছে। "একটি সস্তা শিক্ষার উদাহরণ দেখুন যেখানে আপনি কোনও ক্যাটালগের চিত্র বিশ্লেষণ করতে কোনও বিদ্যমান চিত্র শ্রেণীবদ্ধকারীকে পুনরায় ব্যবহার করছেন computer কম্পিউটার দৃষ্টি সংক্ষিপ্তকরণের সাথে এটি গভীর শিক্ষণ But তবে সেখানে এমন সরঞ্জামগুলি রয়েছে যা সবগুলি প্যাকেজ করেছে। আপনার প্রয়োজন বিভিন্ন সরঞ্জামের মধ্যে পরিমাপ, মূল্যায়ন এবং ভ্যাকিলিট করতে এবং আপনার অবকাঠামোগুলি এতে স্বাগত হওয়া দরকার ""
5. হাইব্রিড লার্নিংয়ের সাথে পরীক্ষা করুন
ডানিং বলেছিল আপনি সস্তা এবং গভীর শিক্ষাকে একত্রে একটি হাইব্রিডের কিছুতে মিশ্রিত করতে পারেন। উদাহরণস্বরূপ, যদি আপনি একটি বিদ্যমান কম্পিউটার ভিশন মডেল গ্রহণ করেন এবং শীর্ষস্থানীয় কয়েকটি স্তর যেখানে সিদ্ধান্ত নেওয়া হয় সেখানে পুনরায় নির্মাণ করেন, তবে আপনি সম্পূর্ণ নতুন ব্যবহারের ক্ষেত্রে একটি বিদ্যমান কাঠামোটিকে সহ-চয়ন করতে পারেন। ডানিং একটি কাগল প্রতিযোগিতার দিকে ইঙ্গিত করেছিলেন যেখানে প্রতিযোগীরা ঠিক তা করেছিলেন; তারা একটি ডেটা সেট নিয়ে একটি কম্পিউটারকে কুকুর থেকে বিড়ালকে আলাদা করতে সাহায্য করার জন্য উপরে একটি নতুন অ্যালগরিদম লিখেছিল।
"এমএল অ্যালগরিদমের জন্য বিড়াল এবং কুকুরের পার্থক্য করা খুব সূক্ষ্ম একটি বিষয়। যুক্তিটির কথা চিন্তা করুন: বিড়ালদের কান পাকানো আছে তবে জার্মান শেফার্ডসও আছে। ডালমাটিয়ানদের বাদে কুকুরের দাগ নেই, ইত্যাদি সনাক্ত করা বেশ কঠিন হতে পারে এবং নিজেই, "ডানিং বলেছেন। "যে লোকটি জিতেছে সে একটি সিস্টেম গড়ে তুলেছিল যা এটি ৯৯ শতাংশ নির্ভুলতার সাথে করেছে But তবে তৃতীয় স্থানটি পাওয়া ব্যক্তিটি থেকে আমি আরও বেশি মুগ্ধ হয়েছি sc স্ক্র্যাচ থেকে বিল্ডিংয়ের পরিবর্তে, তিনি একটি বিদ্যমান কাজ থেকে একটি চিত্রের স্বীকৃতি প্রোগ্রামটি গ্রহণ করেছিলেন, তা খুলে ফেললেন the শীর্ষ স্তরটি এবং সেখানে একটি সাধারণ শ্রেণিবদ্ধ রাখুন some তিনি এর কয়েকটি উদাহরণ দিয়েছিলেন, এবং শীঘ্রই, কুকুর থেকে বিড়ালকে আলাদা করার ক্ষেত্রে এটি 98 শতাংশ নির্ভুল ছিল The পুরো প্রক্রিয়াটি লোকটিকে তিন ঘন্টা সময় নেয় ""
Cheap. সস্তা সস্তা মানে খারাপ নয়
অপ্রকাশিত ধারণা থাকা সত্ত্বেও ডানিং বলেছিলেন যে সস্তা শেখার অর্থ খারাপ পড়াশোনার অর্থ নয়। এমএল বাস্তবায়নে আপনি যে পরিমাণ সময় ব্যয় করেছেন তা সরাসরি তার ব্যবসায়িক মূল্যের সাথে সম্পর্কিত নয়। তিনি আরও বলেন যে আরও গুরুত্বপূর্ণ গুণমানটি প্রক্রিয়াটি পুনরাবৃত্তিযোগ্য এবং নির্ভরযোগ্য তা নিশ্চিত করা। যদি অপ্রয়োজনীয় সংস্থান বিনিয়োগ না করে যদি ব্যবসায় এটি অর্জন করতে সক্ষম হয় তবে তা আরও ভাল।
"সস্তা অর্থ খারাপের অর্থ হয় না। এটি যদি কাজ করে তবে এটি কাজ করে। যদি এটি সস্তা হয় এবং এটি কার্যকর হয় তবে এটি দুর্দান্ত। তবে আপনি এটির যে প্রচেষ্টা করেছেন তা মূল্য নির্ধারণ করে না That's এটি মোটামুটি ব্যর্থতা, " ডানিং বলেছেন। । "মানটি কী সংজ্ঞা দেয় তা হ'ল এটি কীভাবে ব্যবসায়ের উন্নতি করে the যদি লাভগুলি বা ব্যয় হ্রাস করে বা আপনার প্রতিযোগিতামূলক পরিস্থিতির উন্নতি করে It's এটি প্রভাব, প্রচেষ্টা নয়""
7. এটি এআই কল করবেন না
ডানিং জোর দিয়েছিলেন যে, এই কৌশলগুলির বিষয়ে কথা বলার সময়, ব্যবসায়ের সুনির্দিষ্ট পরিভাষা ব্যবহার করা উচিত: এমএল, কম্পিউটার ভিশন বা গভীর শিক্ষণ। এগুলি সমস্তই "কৃত্রিম বুদ্ধিমত্তা" শব্দটির ছাতার আওতায় পড়ে তবে ডানিংয়ের কাছে এআই এর সংজ্ঞাটি কেবল "এমন জিনিস যা এখনও কাজ করে না।"
"আমি এআই-এর জন্য সবচেয়ে ভাল সংজ্ঞাটি শুনেছি এটি হ'ল এটি এখনও আমরা ব্যাখ্যা করতে পারি না The যে জিনিসটি আমরা বের করতে পারি নি, " ডানিং বলেছিলেন। "যতবারই আমরা কাজের জন্য কিছু পেয়েছি, লোকেরা বলে 'ওহ, এটি এআই নয়, এটি কেবল একটি সফটওয়্যার It's এটি কেবল একটি নিয়ম ইঞ্জিন It's এটি সত্যই কেবল লজিস্টিক রিগ্রেশন' ' আমরা কিছু বের করার আগে, আমরা এআই বলি। এরপরে, আমরা সবসময় এটিকে অন্য কিছু বলি many অনেক উপায়ে, এআই পরবর্তী সীমান্তের শব্দ হিসাবে আরও বেশি ব্যবহৃত হয়, এবং এআইতে সর্বদা পরবর্তী সীমান্ত থাকবে tier এআই is আমরা কোথায় যাচ্ছি, যেখানে ইতিমধ্যে পৌঁছেছি সেখানে নয় not"