راهنمای گوگل کلود ویژن | استفاده کاربردی از گوگل کلود ویژن
7 دقیقه
امروزه با توجه به رشد تکنولوژی هوش مصنوعی، احتمالا با کلمه هایی همچون فراگیری ماشین، یادگیری عمیق، پردازش زبان طبیعی، بینایی کامپیوتر، اتوماسیون، تشخیص صدا آَشنا شده اید. به این دلیل که زیاد از این اصطلاحات بر مکالمه های تخصصی امروزی استفاده می شود. در واقع می توان گفت که این رشته به سرعت در حال رشداست. به صورتی که اگر بخواهیم یک تریف قطعی از آن داشته باشیم، کار کمی دشوار می شود. از این رو می توان گفت که هوش مصنوعی بخشی از زندگی ما انسان ها شده است، به همین دلیل می توان ردپای این علم جدید را در تجارت الکترونیک، موتورهای جستجو و بازکردن قفل تلفن مشاهده کرد. با این مقاله از وبسایت ما همراه باشید تا اطلاعات بیشتری از این خدمت جدید گوگل بدست آورید.
کامپیوتر ویژن چیست؟
در حقیقت کامپیوتر ویژن یا بینایی کامپیوتری، مطالعه و ایجاد سیستم های مصنوعی است که اطلاعات را از تصاویر استخراج می کند. همچنین بهتر است بدانید که می تواند در بر گیرنده خود سیستم مکانیکی بینایی باشد. این سیستم به قدری قوی است که می تواند فرآیند تجزیه، تحلیل و تعیین محتوای یک تصویر یا مجموعه ای از تصاویر (و همچنین ویدئو) را نیز انجام دهد. این موضوع می تواند در زمینه پزشکی، عکس ها، فیلم های 360 درجه و تقریبا هر نوع تصویری که فکرش را بکنید، باشد.
بینایی کامپیوتری مجهز به هوش مصنوعی توانایی انجام این قابلیت ها را دارد:
محتوا را شناسایی، برچسب گذاری و دسته بندی کند
تشخیص چهره ها و احساسات
توانایی تشخیص کلاه و عینک روی صورت شما را دارد
می تواند نشانه ها، ساختمان ها و سازه ها را شناسایی کند
اطلاعات دقیق سطح پیکسل مانند داده های رنگ، کیفیت و وضوح را ارزیابی کند
لوگوهای محبوب را بشناسد
متن را به طور کامل شناسایی و بخواند
تصاویر بالقوه نامناسب را شناسایی کند
بینایی کامپیوتری به همراه گوگل کلود ویژن چگونه انجام می گیرد؟
راه های متفاوتی برای استفاده از Vision APO وجود دارد، اما بهتر است که از Cloud Vision API گوگل استفاده کنید. همچنین بهتر است بدانید که گوگل میزبان بسیاری از API های هوش مصنوعی، از جمله پردازش زبان طبیعی، تشخیص صدا، یادگیری عمیق و بینایی است.
در واقع Cloud Vision API به وبسایت ها و برنامه های شما این امکان را می دهد تا تمام آنچه در یک تصویر وجود دارد را درک کنند. کلود ویژن می تواند محتوا را دسته بندی کرده و هرچیزی را که می بیند، برچسب گذاری کند. همچنین شما می توانید از طریق این قابلیت تعامل هوشمندانه ای را با برنامه های ویدئویی برقرار کنید، این کار به واسطه ورودی دوربین یا AR انجام می شود. با توجه به امکاناتی در اختیار شما گذاشته می شود، شما توانایی ساختن ابزارهایی جهت کمک به افراد نابینا یا کم بینا را دارید. یکی از قابلیت های دیگری که توسط این برنامه می توانید ایجاد کنید، این است که با آنالیز ساختمان ها و مکان ها این امکان را به افراد گردشگر بدهید تا بتوانند از طریق شناسایی مکان های عمومی مکان مورد نظر خود را پیدا کنند. بد نیست بدانید که این امکانات در واقع برای آشنایی بیشتر شما با این بخش گفته شد، از این رو نمی توان گفت مطالبی که گفته شد تمام بحث های این حوزه را پوشش می دهد. به همین دلیل می توان گفت که امکانات ساخته شده به وسیله این علم بی پایان هستند.
بیشتر بخوانید: RFP چیست؟
-
ساختن یک پروژه Cloud
اگر قبلا از API های گوگل استفاده کرده اید، ساختن یک پروژه کلود برای شما دشوار نخواهد بود. برای ساخت یک پروژه در گوگل مانند سایر سرویس ها باید یک پروژه ابری را راه اندازی نمایید. به کنسول Google Cloud Platform رفته و در آن جا یک پروژه جدید ایجاد نمایید، اگر از قبل روی آن پروژه دارید، می توانید از میان پروژه های موجود یکی را انتخاب نمایید. همانطور که می دانید بسیاری از سرویس های گوگل رایگان در اختیار کاربران قرار گرفته است، ساخت کلود هم خارج از این قائده نیست و رایگان انجام می شود. اما بهتر است بدانید که اگر ساخت کلود بیش از محدوده تعیین شده برود، باید هزینه پرداخت نمایید.
-
Cloud Vision API را فعال کنید
در این قسمت باید راهنمای Google's Cloud Vision: Cloud Vision API را فعال نماید. در مرحله بعد باید کتابخانه API را مرور کرده و سپس Cloud Vision API را فعال کنید. در مرحله بعدی پس از مرور کردن کتابخانه API نوبت به انتخاب Cloud Vision API برای پروژه شما است. زمانی که مراحل به درستی پیش برود و کلود ویژن فعال شود، شما باید یک علامت سبز رنگ و پیام "API Enable" را در کنار آن مشاهده کنید.
-
یک حساب کاربری ایجاد کنید
در این مرحله باید یک حساب سرویس راه اندازی کنید. بهترین روش برای استفاده از این ویژگی تنظیم کردن آن برای حالت معمولی است. همچنین اگر می خواهید از امکانات کامل آن استفاده نمایید، بایستی مراحل احراز هویت را انجام دهید.
-
کلید خصوصی را دانلود کنید
زمانی که شما یک پروژه با API فعال و یک حساب سرویس دارید، می توانید کلید خصوصی خود را به عنوان یک فایل JSON دانلود کنید. حتما حواستان باشد که فایل را کجا ذخیره می کنید، زیرا در مراحل بعدی به کارتان می آید.
-
تنظیم کردن متغیر محیطی
برای ادامه کار باید متغیر محیطی با عنوان GOOGLE_APPLICATION_CREDENTIALS را ایجاد نمایید تا بتوان از طریق آن API گرفت. این متغیر در واقع به فایل JSON اشاره می کند که به تازگی دانلود کرده اید. با این کار دیگر نمی خواهد برای هر بار استفاده کل مسیر را تایپ کنید. برای تکمیل این مرحله باید یک ترمینال جدید باز کرده و از دستور صادرات زیر استفاده کنید:
GOOGLE_APPLICATION_CREDENTIALS="/Users/[username]/Downloads/[file_name].json
استفاده کنید: کاربران ویندوزی می توانند همین کار را با استفاده از خط فرمان نیز انجام دهند:
env:GOOGLE_APPLICATION_CREDENTIALS="C:User$"[username]Downloads[FILE_NAME].jason
-
حال می توانید از API استفاده کنید
اکنون شما آماده هستید تا در Cloud Vision API کنکاش کنید. بهتر است از curl برای انجام آزمایش های سریع API استفاده کنید.
-
کتابخانه سمت کاربر را نصب کنید
در مرحله بعد باید یک برنامه ساده مبتنی بر وب ایجاد کنید تا نحوه ادغام API را درپروژه های خود نشان دهید. برای زبان های مختلف برنامه نویسی SDK وجود دارد تا کار یکپارچه سازی آسان تر شود. اما بهتر است که شما در این پروژه از PHP SDK استفاده کنید. با خیال راحت می توانید از پروژه در سرور محلی یا به صورت راه دور استفاده کنید. در این راه بهتر است که از Composer استفاده کنید، همچنین ممکن است که به صورت پیش فرض روی PC شما وجود داشته باشد. اگر هر سوالی در این مورد داشتید، می توانید از منبع Composer بهره ببرید.
-
یک فایل جدید ایجاد کنید
یک فایل PHP جدید در پوشه پروژه خود ایجاد کنید، همچنین آن را هر طور که دوست دارید تنظیم کنید. اما حتما درون آن از یک فرم ساده HTML برای آپلود تصاویر که بتوانید آزمایش سریع روی آن انجام دهید، استفاده کنید.
-
ذخیره کردن تصویر
اگر قصد این را دارید که به تصاویر به صورت آفلاین دسترسی داشته باشید که بهتر است از این مرحله رد شوید.
-
اضافه کردن متغیر محیطی
برای اینکه بتوانید به صورت کامل احراز هویت نمایید، باید متغیر GOOGLE_APPLICATION-CREDENTIALS را تنظیم کنید. در PHP از دستور putenv برای تنظیم یک متغیر محیطی استفاده می شود. نحوه استفاده از آن به این صورت است:
Putenv('GOOGLE_APPLICATION_CREDENTIALS=/Users/richardmattka/Downloads/VisionTutorial 1-;0f464a9a0f7b.json
-
Include کردن کتابخانه
زمانی که کتابخانه را به پروژه خود اضافه کردید، باید کلاس LanguageClient را در کد خود مقداردهی نمایید.
-
محتوای تصویر را تجزیه و تحلیل کنید
از طریق API مربوطه تصویر خود را ارسال نمایید تا بتوانید تجزیه و تحلیل کنید. فعلا نتیجه را به صورت JSON روی صفحه نمایش خواهید داد، اما در عمل می توانید نتایج را ارزیابی کرده و به هر نحوی که می خواهید از آن ها استفاده کنید.
-
تشخیص چهره
راهنمای Google's Cloud Vision: تشخیص چهره
از طریق قابلیت FaceDetection در Vision API، می توانید احساسات و جعبه های محدود چهره ها را در تصویر پیدا کنید. با این کار شما توانایی دسترسی به داده های احساسی و همچنین اطلاعات مکان مربوط به جایی که در تصویر چهره ها هستند را دارید.
بیشتر بخوانید: RSSچیست ؟ کاربرد های مهم RSS ونحوه فعال سازی آن
سخن تکمیلی
کارایی Cloud Vision بیشتر از این مطالبی که در این مقاله گفته شد، است. از این رو ما سعی کردیم تا بهترین و جالبترین آن را به شما ارائه دهیم. اگر انجام هر یک از مراحل مشکل یا ایرادی داشتید، می توانید آن را در گوگل جستجو کرده یا از کارشناسان طراحی سایت در مشهد ;ما کمک بگیرید.