مقدمه آشنایی و آموزش هوش مصنوعی
|
|
|
|
دوره "هوش مصنوعی برای مبتدیان" شرکت Microsoft
|
یکی از منابع مفید برای آشنایی افراد مبتدی با هوش مصنوعی (Generative AI for Beginners)، مجموعهای از دورههای آموزشی با عنوان "هوش مصنوعی برای مبتدیان" است که توسط شرکت Microsoft تهیه شده است. این دورهها یکی از بهترین گزینههای رایگان برای شروع یادگیری مفاهیم و ویژگیهای پایهای هوش مصنوعی به شمار میآیند. این مجموعه از طریق لینکهایی که در ادامه ارائه شده است، در دسترس است.
لینکهای دانلود ویدئوهای این دوره بههمراه زیرنویس فارسی آنها در ادامه قرار داده شده است. (لینک مربوط به کانال تلگرام) 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 عناوین و محتوای دوره:01: Introduction to Generative AI and LLMs (Learn: Understanding what Generative AI is and how Large Language Models (LLMs) work.) قسمت ۱ در این قسمت: معرفی ایده استارتاپی ما و ماموریتی که دنبال میکنیم،
02: Exploring and comparing different LLMs (Learn: How to select the right model for your use case) قسمت ۲ در این قسمت:
03: Using Generative AI Responsibly (Learn: How to build Generative AI Applications responsibly) قسمت ۳ در این قسمت:
04: Understanding Prompt Engineering Fundamentals (Learn: Hands-on Prompt Engineering Best Practices) قسمت ۴ در این قسمت:
05: Creating Advanced Prompts (Learn: How to apply prompt engineering techniques that improve the outcome of your prompts.) قسمت ۵ در این قسمت:
06: Building Text Generation Applications (Build: A text generation app using Azure OpenAI / OpenAI API) قسمت ۶ در این قسمت:
07: Building Chat Applications (Build: Techniques for efficiently building and integrating chat applications.) قسمت ۷ در این قسمت:
08: Building Search Apps Vector Databases (Build: A search application that uses Embeddings to search for data.) قسمت ۸ در این قسمت:
09: Building Image Generation Applications (Build: An image generation application) قسمت ۹ در این قسمت:
10: Building Low Code AI Applications (Build: A Generative AI application using Low Code tools) قسمت ۱۰ در این قسمت:
11: Integrating External Applications with Function Calling (Build: What is function calling and its use cases for applications) قسمت ۱۱ در این قسمت:
12: Designing UX for AI Applications (Learn: How to apply UX design principles when developing Generative AI Applications) قسمت ۱۲ در این قسمت:
13: Securing Your Generative AI Applications (Learn: The threats and risks to AI systems and methods to secure these systems.) قسمت ۱۳ در این قسمت:
14: The Generative AI Application Lifecycle (Learn: The tools and metrics to manage the LLM Lifecycle and LLMOps) قسمت ۱۴ در این قسمت:
15: Retrieval Augmented Generation (RAG) and Vector Databases (Build: An application using a RAG Framework to retrieve embeddings from a Vector Databases) قسمت ۱۵ در این قسمت:
16: Open Source Models and Hugging Face (Build: An application using open source models available on Hugging Face) قسمت ۱۶ در این قسمت:
17: AI Agents (Build: An application using an AI Agent Framework) قسمت ۱۷ در این قسمت:
18: Fine-Tuning LLMs (Learn: The what, why and how of fine-tuning LLMs) قسمت ۱۸ در این قسمت:
|
| آکادمی هوش مصنوعی OpenAI |
OpenAI Academy یک پلتفرم آموزشی است که توسط شرکت OpenAI راهاندازی شده تا دسترسی به دانش هوش مصنوعی را برای همه افراد، صرفنظر از پیشزمینه یا تخصص، فراهم کند. هدف اصلی این آکادمی گسترش آموزش هوش مصنوعی و فراهمکردن فرصت برابر برای یادگیری و استفاده از ابزارهای هوش مصنوعی برای همه افراد است. ویژگیهای کلیدی OpenAI Academy:
در مجموع، OpenAI Academy بستری است برای یادگیری و بهکارگیری هوش مصنوعی به زبان ساده و کاربردی، با هدف ایجاد فرصتهای برابر برای همه علاقهمندان در سراسر جهان. |
مهندسی پرامپت (Prompt Engineering) مبحثی حیاتی در حوزه هوش مصنوعی است که آشنایی با آن برای کاربران ابزارهای هوش مصنوعی ضروری است. به همین منظور، صفحهای تحت عنوان «پرامپتهای کاربری» ایجاد شده است. این صفحه علاوه بر ارائه لیستی از پرامپتهای آماده، شامل محتوای آموزشی مرتبط نیز میشود. لذا به کاربرانی که به دنبال ارتقاء دانش و بهبود کاربرد خود در استفاده از هوش مصنوعی هستند، اکیداً توصیه میشود از بخش آموزشهای ابتدای این صفحه دیدن کنند.
منابع تخصصیتر
این منابع معمولاً عمیقتر و تخصصیتر هستند و برای افرادی مناسباند که قصد دارند در حوزه هوش مصنوعی به مطالعه، تحقیق و بررسی گستردهتری بپردازند.
- A practical guide to building agents: a-practical-guide-to-building-agents.pdf | (Link on OpenAi website)
- AI in the Enterprise: ai-in-the-enterprise.pdf | (Link on OpenAi website)
- Google Agent Whitepaper: (Link on Kaggle website)
- Anthropic Agent Framework: (Link on Anthropic website)
- Anthropic Coding Practices: (Link on Anthropic website)
- Understanding Large Language Model: یک پلیلیست که با بهرهگیری از تصاویر و محتوای گرافیکی جذاب، مفاهیم پایهای مرتبط با مدلهای زبانی بزرگ LLM و معماری ترنسفورمر1 را بهشیوهای بسیار واضح و قابل فهم تشریح میکند.
مقدمهای بر هوش مصنوعی
هوش مصنوعی: راهکاری نوین برای دنیای تازه تولید محتوا!
تا به حال به این موضوع فکر کردهاید که هوش مصنوعی چطور میتواند یک ابرقهرمان در زمینه تولید محتوا از شما بسازد؟ این فناوری نه تنها کیفیت و سرعت فعالیتهای شما را بهبود میبخشد، بلکه شما را به یک استاد فرآوری محتوای دیجیتال تبدیل میکند.
مدلهای زبانی گسترده، درست مانند ساحران دنیای دیجیتال عمل میکنند. با استفاده از این مدلها، تولید متن و محتوایتان را تسهیل کرده و تجربهای ماندگار خلق کنید. این مدلها قابلیتهای بسیار مؤثر و گستردهای دارند و کافی است که کمی با آنها آشنا شوید تا اثرگذاری شگرفشان بر کارهایتان را ببینید.
اما هوش مصنوعی تنها در تولید متن پیشرفت نکرده است؛ در همه حوزهها، از نوآوری گرفته تا خلاقیت، هوش مصنوعی فرصتهای منحصربهفردی به ارمغان آورده است. بنابراین، فرصتی نایاب در اختیار شما است که ترکیب این ابزارهای قدرتمند را برای پیشرفت در عرصه فرهنگی و جمعآوری ثروتهای معنویتان به کار گیرید. امیدوار به موفقیتهای پیشرو بوده و با اعتماد وارد دنیای جدید شوید. فرصتی کمنظیری پیش روی شما است تا حوزههای فعالیت خود را به شکل قابلتوجهی توسعه دهید!
مقدمهای بر مدلهای بزرگ زبان (2LLM)
مدلهای زبان بزرگ (LLM)ها، سیستمهای هوش مصنوعی قدرتمندی هستند که با قابلیتهای جذاب و شگفتانگیز خود، میتوانند به درک عمیق سؤالات کاربران بپردازند و به صورت تعاملی با آنها مکالمه کنند تا کاربر بتواند به بهترین شکل به هدف خود برسد. این مدلها قادرند به صورت هوشمندانه به سوالات پاسخ دهند، مکالمه را ادامه دهند و به طور کامل نیازهای کاربران را درک کنند. توانایی آنها در پردازش و تولید متون طبیعی به گونهای است که کاربران میتوانند احساس کنند با یک انسان در حال مکالمه هستند. این تعامل طبیعی باعث میشود کاربران بتوانند به راحتی به اهداف خود دست یابند، چه در زمینه جستجوی اطلاعات، تولید محتوا یا هر کاربرد دیگری. این مدلها میتوانند برای مواردی از قبیل ترجمه زبان، تولید محتوا، چت با کاربران و پاسخ به سوالات مورد استفاده قرار گیرند. در اینجا به معرفی برخی از مدلهای شناختهشده و سرویسهای اصلی آنها میپردازیم:
در حال حاضر، چندین شرکت بزرگ و پیشرو در زمینه توسعه هوش مصنوعی فعالیت میکنند. OpenAI با توسعه ChatGPT و GPT-4، به عنوان یکی از پیشگامان این عرصه شناخته میشود که با همکاری استراتژیک با مایکروسافت، گامهای بزرگی در این زمینه برداشته است. Google DeepMind، با توسعه مدلهای قدرتمندی مانند Gemini و PaLM، و موفقیتهای چشمگیر در زمینه یادگیری تقویتی و پردازش زبان طبیعی، نقش مهمی در پیشرفت این فناوری داشته است. همچنین شرکتهای نوظهوری مانند Anthropic با توسعه Claude، به رقابت در این عرصه پیوستهاند و با تمرکز بر ایمنی و اخلاق در هوش مصنوعی، مسیر جدیدی را در این حوزه ترسیم میکنند.
نکته قابل توجه در مورد این هوشهای مصنوعی، روش یادگیری و آموزش آنهاست. این سیستمها با استفاده از حجم عظیمی از دادهها آموزش میبینند؛ برای مثال، GPT-3 با بیش از ۴۵ ترابایت متن خام آموزش دیده است که شامل کتابها، مقالات، صفحات وب و انواع متون دیگر میشود. این حجم از داده معادل میلیونها کتاب است که به هوش مصنوعی کمک میکند تا الگوها را شناسایی کند، ارتباطات را درک کند و بتواند پاسخهای مناسب و منطقی تولید کند. این فرآیند یادگیری مشابه یادگیری انسان است، اما در مقیاسی بسیار بزرگتر و با سرعتی بسیار بالاتر.
یکی از نقاط عطف در تاریخ هوش مصنوعی، معرفی ChatGPT در نوامبر ۲۰۲۲ بود. این چتبات هوشمند با شکستن رکورد سریعترین رشد کاربر در تاریخ و جذب ۱۰۰ میلیون کاربر فعال ماهانه در تنها ۲ ماه، به یک پدیده جهانی تبدیل شد. موفقیت چشمگیر ChatGPT را میتوان به رابط کاربری ساده و در دسترس، تواناییهای شگفتانگیز در درک و تولید متن، رایگان بودن نسخه پایه و البته تبلیغات دهان به دهان و پوشش رسانهای گسترده نسبت داد.
این پیشرفتها منجر به ایجاد یک اکوسیستم گسترده شده است که در آن، شرکتهای کوچکتر میتوانند از طریق APIها به قدرت مدلهای بزرگ هوش مصنوعی دسترسی پیدا کنند. این ساختار مانند یک پل ارتباطی عمل میکند و به شرکتها اجازه میدهد بدون نیاز به سرمایهگذاری عظیم در زیرساختها، از قابلیتهای هوش مصنوعی در محصولات و خدمات خود استفاده کنند.
صفحه ویکیپدیا مربوط به «مدل زبانی بزرگ»
سایر خدمات و امکانت قابل استفاده هوش مصنوعی
در کنار مدلهای زبانی بزرگ، هوش مصنوعی کاربردهای متنوع و ارزشمندی برای موسسات فرهنگی دارد که شامل استفاده از فناوری پردازش صوت برای تبدیل مصاحبهها و فایلهای صوتی به متن، تولید تصاویر و طرحهای گرافیکی متناسب با نیازهای رسانهای، تهیه فایلهای ارائه (PowerPoint Presentation) و گزارشهای حرفهای و جذاب، ارائه خدمات بهتر به بازدیدکنندگان با استفاده از چتباتهای هوشمند، و بهرهگیری از سیستمهای ترجمه خودکار برای دسترسپذیر کردن محتوا برای مخاطبان بینالمللی و دسترسی به ترجمههای سریع و باکیفیت میشود. تمامی این کاربردها میتواند به افزایش کارایی و بهبود چشمگیر خدمات این موسسات کمک شایانی کند. البته اینها تنها نمونههایی از کاربردهای متنوع هوش مصنوعی هستند و با توجه به پیشرفت سریع این فناوری، میتوان استفادههای بسیار متنوعتر و خلاقانهتری را برای موسسات فرهنگی متصور بود.
چگونهیک نکته در استفاده از اینهوش مجموعهمصنوعی: استفادهچگونه کنیم؟
با تعامل صحیح، ذهن خود را ارتقا دهیم؟
واژهنامه میتوانندمفاهیم باکلیدی مروردر این صفحه، سرویس های مورد نظر خود را انتخاب کرده وحوزه استفاده کنند.
از طرفی جهت سهولت کار افرادی که زمان و انگیزه زیادی برای بررسی دقیق موارد مورد اشاره ندارند، مطلبی تحت عنوان پیشنهاد خرید سرویسهای هوش مصنوعی آماده
RAG یا Retrieval Augmented Generation، یک چارچوب هوش مصنوعی است که کاربربا ترکیب مدلهای زبانی بزرگ (LLM) با مراجعهیک سیستم بازیابی اطلاعات خارجی، به بهبود قابل توجهی در عملکرد آنها منجر میشود. در این روش، پیش از آنکه LLM پاسخی به درخواست کاربر تولید کند، ابتدا اطلاعات مرتبط از یک پایگاه دانش بهروز (مانند اسناد شرکت، مقالات تحقیقاتی، یا وبسایتها) بازیابی شده و به عنوان زمینه و اطلاعات تکمیلی در اختیار LLM قرار میگیرد. این فرآیند به LLM کمک میکند تا پاسخهایی دقیقتر، مرتبطتر، و مبتنی بر واقعیت ارائه دهد و از ارائه اطلاعات نادرست یا منسوخ که صرفاً بر اساس دادههای آموزشی اولیه مدل هستند (پدیدهای که به آن "توهم" یا Hallucination گفته میتواندشود) جلوگیری کند. اهمیت RAG در این است که بدون نیاز به بازآموزی پرهزینه و زمانبر LLMها، امکان دسترسی آنها به جدیدترین اطلاعات و دانش تخصصی را فراهم میکند، و در نتیجه قابلیت اطمینان و کاربردی بودن آنها را در دنیای واقعی به شدت افزایش میدهد.
کاربردهای RAG بسیار گسترده و متمرکز بر افزایش دقت و اتکاپذیری LLMها هستند. از جمله مهمترین کاربردها میتوان به ساخت چتباتها و دستیارهای مجازی بسیار هوشمند برای پشتیبانی مشتریان اشاره کرد که قادرند با توجهاستناد به بودجه،اسناد و راهنماهای فنی شرکت، پاسخهای دقیق و بهروز به سوالات کاربران ارائه دهند. همچنین، RAG در سیستمهای پرسش و پاسخ پیشرفته که نیاز به اطلاعات تخصصی و تعدادجاری کاربران،دارند، سرویسابزارهای خلاصهسازی متون طولانی با حفظ نکات کلیدی مبتنی بر منبع، و تولید محتوایی که باید بر اساس دادههای خاص و تایید شده باشد (مانند گزارشهای مالی یا تحلیلهای حقوقی)، نقش حیاتی ایفا میکند. با فراهم آوردن امکان استناد به منابع و ارائه پاسخهای مبتنی بر دادههای مشخص، RAG نه تنها کیفیت خروجی LLMها را بهبود میبخشد، بلکه شفافیت و اعتماد کاربران به این سیستمها را نیز افزایش داده و راه را برای استفاده گستردهتر و مسئولانهتر از هوش مصنوعی مناسبمولد خودهموار رامیسازد.
Hallucination
توهم یا Hallucination در مدلهای زبانی بزرگ (LLM) به پدیدهای اطلاق میشود که در آن، مدل، اطلاعاتی تولید میکند که به نظر منطقی و خریداریمعتبر کردهمیآید، واما از آن استفاده کند.
در سایرحقیقت بخشها،نادرست، تحتبیاساس عنوانیا مشترکنامرتبط «راهکارهایبا مبتنی بر IT»، راهنماهایی تفصیلی و گام به گام برای دستیابی به خروجیها و نتایج پرکاربرد،ورودی ارائه شده است.
- این
راهکارهای مبتنی بر IT: پیادهسازی مصاحبه و تهیه خروجی از آنهاراهکارهای مبتنی بر IT: تحلیل منابع مختلف و خلاصهسازی و صورتبندی آنها(هنوز ایجاد نشده-در حال تکمیل)راهکارهای مبتنی بر IT: تولید تصویر (عکس، طراحی گرافیکی و ...)(هنوز ایجاد نشده-در حال تکمیل)راهکارهای مبتنی بر IT: ترجمه(هنوز ایجاد نشده-در حال تکمیل)
شاملراهکارهای مبتنی بر IT: بُرِش، ویرایش و تبدیل فایلخروجیهایصوتیوهمآلودومیتوانندتصویریارائه
ساختگی بهعنوان واقعیت، استنتاجهای غیرمنطقی، یا پاسخهایی باشند که با توجهزمینه بهگفتگو محدودیتهاییا دانش موجود در ایرانجهان واقعی همخوانی ندارند. برخلاف خطاهای معمول که ممکن است ناشی از درک نادرست پرسش یا محدودیتهای فنی باشند، توهم زمانی رخ میدهد که مدل با اطمینان ظاهری، اطلاعات غلط ارائه میدهد. ریشه این پدیده در ماهیت آماری و الگوریتمی این مدلها نهفته است؛ LLMها بر اساس الگوها و روابط موجود در حجم عظیم دادههای آموزشی خود عمل میکنند و فاقد درک یا آگاهی واقعی از جهان هستند. بنابراین، توهمات آنها صرفاً بازتابی از این الگوهای آماری است و نه فرآیندهای شناختی یا ادراکی مشابه انسان.
بروز توهم در LLMها چالشهای قابل توجهی را به همراه دارد. این پدیده میتواند منجر به انتشار اطلاعات نادرست و گمراهکننده شود که اعتبار و قابلیت اطمینان این سیستمها را زیر سوال میبرد، بهویژه در کاربردهای حساس مانند پزشکی، حقوق یا مهندسی که دقت اطلاعات حیاتی است. علاوه بر این، تشخیص توهمات برای کاربران، بهخصوص افراد غیرمتخصص، دشوار است، زیرا پاسخهای تولید شده اغلب بسیار متقاعدکننده به نظر میرسند. دلایل مختلفی برای وقوع توهم ذکر شده است، از جمله کاستیها و سوگیریها در دادههای آموزشی، پیچیدگی در تفسیر دستورات (prompts)، محدودیت در بازیابی دقیق اطلاعات مرتبط از حافظه مدل و حتی تلاش مدل برای ارائه پاسخهای متنوع و خلاقانه. تلاشهای زیادی برای کاهش این پدیده در حال انجام است، از جمله بهبود کیفیت دادههای آموزشی، توسعه تکنیکهای پیشرفتهتر برای همراستاسازی مدل با اهداف کاربر (alignment)، و ایجاد مکانیسمهایی برای ارزیابی و صحتسنجی خروجیهای مدل. با این حال، توهم همچنان یکی از موانع اصلی در مسیر پذیرش گسترده و استفاده قابل اعتماد از مدلهای زبانی بزرگ محسوب میشود.
Knowledge Cutoff
مفهوم «knowledge cutoff» یا «نقطه قطع دانش» در مدلهای زبانی بزرگ (LLM) به تاریخی اشاره دارد که دادههای اصلی آموزشی آن مدل به پایان میرسد و دانش پایه آن بر اساس اطلاعات تا همان زمان شکل گرفته است. این بدان معناست که LLM ذاتاً از وقایع، اکتشافات یا اطلاعات جدیدتری که پس از آن تاریخ رخ دادهاند، آگاهی مستقیمی در حافظه داخلی خود ندارد. با این حال، این محدودیت مطلق نیست. LLMهای مدرن از روشهایی مانند ادغام با ابزارهای جستجوی وب برای بازیابی اطلاعات لحظهای، استفاده از تکنیک RAG (Retrieval Augmented Generation) برای دسترسی به این سرویسپایگاههای مختلفدانش هوشخارجی مصنوعی،و دوبهروز، راهنمایو تکمیلییا بهروزرسانیهای دورهای مدل برای گنجاندن دادههای جدیدتر، بهره میبرند تا این شکاف دانشی را پر کنند. بنابراین، اگرچه نقطه قطع دانش یک واقعیت اساسی در معماری LLMهاست، توانایی آنها در ارائه روشاطلاعات در مورد وقایع روز به طور فزایندهای به این مکانیزمهای خریدجانبی سرویسهایبرای غیر ایرانی (راهکارهای پرداخت دلاری)دسترسی و تحریمشکنپردازش نیزاطلاعات درجدید نظروابسته گرفتهاست، شدههرچند است.دقت و جامعیت این راهنماهاپاسخها درهمچنان لینکهاینیازمند زیرتوجه درو دسترسبررسی هستند:است.
