راهنمای گوگل کلود ویژن | استفاده کاربردی از گوگل کلود ویژن
6 دقیقه
امروزه با توجه به رشد تکنولوژی هوش مصنوعی، احتمالا با کلمههایی همچون فراگیری ماشین، یادگیری عمیق، پردازش زبان طبیعی، بینایی کامپیوتر، اتوماسیون، تشخیص صدا آَشنا شدهاید. به این دلیل که زیاد از این اصطلاحات بر مکالمههای تخصصی امروزی استفاده میشود. در واقع میتوان گفت که این رشته به سرعت در حال رشداست. به صورتی که اگر بخواهیم یک تریف قطعی از آن داشته باشیم، کار کمی دشوار میشود. از این رو میتوان گفت که هوش مصنوعی بخشی از زندگی ما انسانها شده است، به همین دلیل میتوان ردپای این علم جدید را در تجارت الکترونیک، موتورهای جستجو و بازکردن قفل تلفن مشاهده کرد. با این مقاله از وبسایت ما همراه باشید تا اطلاعات بیشتری از این خدمت جدید گوگل بدست آورید.
کامپیوتر ویژن چیست؟
در حقیقت کامپیوتر ویژن یا بینایی کامپیوتری، مطالعه و ایجاد سیستمهای مصنوعی است که اطلاعات را از تصاویر استخراج میکند. همچنین بهتر است بدانید که میتواند در بر گیرنده خود سیستم مکانیکی بینایی باشد. این سیستم به قدری قوی است که میتواند فرآیند تجزیه، تحلیل و تعیین محتوای یک تصویر یا مجموعهای از تصاویر (و همچنین ویدئو) را نیز انجام دهد. این موضوع میتواند در زمینه پزشکی، عکسها، فیلمهای 360 درجه و تقریبا هر نوع تصویری که فکرش را بکنید، باشد.
بینایی کامپیوتری مجهز به هوش مصنوعی توانایی انجام این قابلیتها را دارد:
محتوا را شناسایی، برچسب گذاری و دستهبندی کند
تشخیص چهرهها و احساسات
توانایی تشخیص کلاه و عینک روی صورت شما را دارد
میتواند نشانهها، ساختمانها و سازهها را شناسایی کند
اطلاعات دقیق سطح پیکسل مانند دادههای رنگ، کیفیت و وضوح را ارزیابی کند
لوگوهای محبوب را بشناسد
متن را به طور کامل شناسایی و بخواند
تصاویر بالقوه نامناسب را شناسایی کند
بینایی کامپیوتری به همراه گوگل کلود ویژن چگونه انجام میگیرد؟
راههای متفاوتی برای استفاده از Vision APO وجود دارد، اما بهتر است که از Cloud Vision API گوگل استفاده کنید. همچنین بهتر است بدانید که گوگل میزبان بسیاری از APIهای هوش مصنوعی، از جمله پردازش زبان طبیعی، تشخیص صدا، یادگیری عمیق و بینایی است.
در واقع Cloud Vision API به وبسایتها و برنامههای شما این امکان را میدهد تا تمام آنچه در یک تصویر وجود دارد را درک کنند. کلود ویژن میتواند محتوا را دستهبندی کرده و هرچیزی را که میبیند، برچسب گذاری کند. همچنین شما میتوانید از طریق این قابلیت تعامل هوشمندانهای را با برنامههای ویدئویی برقرار کنید، این کار به واسطه ورودی دوربین یا AR انجام میشود. با توجه به امکاناتی در اختیار شما گذاشته میشود، شما توانایی ساختن ابزارهایی جهت کمک به افراد نابینا یا کم بینا را دارید. یکی از قابلیتهای دیگری که توسط این برنامه میتوانید ایجاد کنید، این است که با آنالیز ساختمانها و مکانها این امکان را به افراد گردشگر بدهید تا بتوانند از طریق شناسایی مکانهای عمومی مکان مورد نظر خود را پیدا کنند. بد نیست بدانید که این امکانات در واقع برای آشنایی بیشتر شما با این بخش گفته شد، از این رو نمیتوان گفت مطالبی که گفته شد تمام بحثهای این حوزه را پوشش میدهد. به همین دلیل میتوان گفت که امکانات ساخته شده به وسیله این علم بی پایان هستند. در ضمن در هر مرحله از طراحی سایت در مشهد اگر مشکلی داشتید، میتوانید از کارشانان ما کمک بگیرید.
-
ساختن یک پروژه Cloud
اگر قبلا از APIهای گوگل استفاده کردهاید، ساختن یک پروژه کلود برای شما دشوار نخواهد بود. برای ساخت یک پروژه در گوگل مانند سایر سرویسها باید یک پروژه ابری را راهاندازی نمایید. به کنسول Google Cloud Platform رفته و در آن جا یک پروژه جدید ایجاد نمایید، اگر از قبل روی آن پروژه دارید، میتوانید از میان پروژههای موجود یکی را انتخاب نمایید. همانطور که میدانید بسیاری از سرویسهای گوگل رایگان در اختیار کاربران قرار گرفته است، ساخت کلود هم خارج از این قائده نیست و رایگان انجام میشود. اما بهتر است بدانید که اگر ساخت کلود بیش از محدوده تعیین شده برود، باید هزینه پرداخت نمایید.
-
Cloud Vision API را فعال کنید
در این قسمت باید راهنمای Google's Cloud Vision: Cloud Vision API را فعال نماید. در مرحله بعد باید کتابخانه API را مرور کرده و سپس Cloud Vision API را فعال کنید. در مرحله بعدی پس از مرور کردن کتابخانه API نوبت به انتخاب Cloud Vision API برای پروژه شما است. زمانی که مراحل به درستی پیش برود و کلود ویژن فعال شود، شما باید یک علامت سبز رنگ و پیام "API Enable" را در کنار آن مشاهده کنید.
-
یک حساب کاربری ایجاد کنید
در این مرحله باید یک حساب سرویس راهاندازی کنید. بهترین روش برای استفاده از این ویژگی تنظیم کردن آن برای حالت معمولی است. همچنین اگر میخواهید از امکانات کامل آن استفاده نمایید، بایستی مراحل احراز هویت را انجام دهید.
-
کلید خصوصی را دانلود کنید
زمانی که شما یک پروژه با API فعال و یک حساب سرویس دارید، میتوانید کلید خصوصی خود را به عنوان یک فایل JSON دانلود کنید. حتما حواستان باشد که فایل را کجا ذخیره میکنید، زیرا در مراحل بعدی به کارتان میآید.
-
تنظیم کردن متغیر محیطی
برای ادامه کار باید متغیر محیطی با عنوان GOOGLE_APPLICATION_CREDENTIALS را ایجاد نمایید تا بتوان از طریق آن API گرفت. این متغیر در واقع به فایل JSON اشاره میکند که به تازگی دانلود کردهاید. با این کار دیگر نمیخواهد برای هر بار استفاده کل مسیر را تایپ کنید. برای تکمیل این مرحله باید یک ترمینال جدید باز کرده و از دستور صادرات زیر استفاده کنید:
GOOGLE_APPLICATION_CREDENTIALS="/Users/[username]/Downloads/[file_name].json
استفاده کنید: کاربران ویندوزی میتوانند همین کار را با استفاده از خط فرمان نیز انجام دهند:
env:GOOGLE_APPLICATION_CREDENTIALS="C:User$"[username]Downloads[FILE_NAME].jason
-
حال میتوانید از API استفاده کنید
اکنون شما آماده هستید تا در Cloud Vision API کنکاش کنید. بهتر است از curl برای انجام آزمایشهای سریع API استفاده کنید.
-
کتابخانه سمت کاربر را نصب کنید
در مرحله بعد باید یک برنامه ساده مبتنی بر وب ایجاد کنید تا نحوه ادغام API را درپروژههای خود نشان دهید. برای زبانهای مختلف برنامه نویسی SDK وجود دارد تا کار یکپارچه سازی آسانتر شود. اما بهتر است که شما در این پروژه از PHP SDK استفاده کنید. با خیال راحت میتوانید از پروژه در سرور محلی یا به صورت راه دور استفاده کنید. در این راه بهتر است که از Composer استفاده کنید، همچنین ممکن است که به صورت پیشفرض روی PC شما وجود داشته باشد. اگر هر سوالی در این مورد داشتید، میتوانید از منبع Composer بهره ببرید.
-
یک فایل جدید ایجاد کنید
یک فایل PHP جدید در پوشه پروژه خود ایجاد کنید، همچنین آن را هر طور که دوست دارید تنظیم کنید. اما حتما درون آن از یک فرم ساده HTML برای آپلود تصاویر که بتوانید آزمایش سریع روی آن انجام دهید، استفاده کنید.
-
ذخیره کردن تصویر
اگر قصد این را دارید که به تصاویر به صورت آفلاین دسترسی داشته باشید که بهتر است از این مرحله رد شوید.
-
اضافه کردن متغیر محیطی
برای اینکه بتوانید به صورت کامل احراز هویت نمایید، باید متغیر GOOGLE_APPLICATION-CREDENTIALS را تنظیم کنید. در PHP از دستور putenv برای تنظیم یک متغیر محیطی استفاده میشود. نحوه استفاده از آن به این صورت است:
Putenv('GOOGLE_APPLICATION_CREDENTIALS=/Users/richardmattka/Downloads/VisionTutorial 1-;0f464a9a0f7b.json
-
Include کردن کتابخانه
زمانی که کتابخانه را به پروژه خود اضافه کردید، باید کلاس LanguageClient را در کد خود مقداردهی نمایید.
-
محتوای تصویر را تجزیه و تحلیل کنید
از طریق API مربوطه تصویر خود را ارسال نمایید تا بتوانید تجزیه و تحلیل کنید. فعلا نتیجه را به صورت JSON روی صفحه نمایش خواهید داد، اما در عمل میتوانید نتایج را ارزیابی کرده و به هر نحوی که میخواهید از آنها استفاده کنید.
-
تشخیص چهره
راهنمای Google's Cloud Vision: تشخیص چهره
از طریق قابلیت FaceDetection در Vision API، میتوانید احساسات و جعبههای محدود چهرهها را در تصویر پیدا کنید. با این کار شما توانایی دسترسی به دادههای احساسی و همچنین اطلاعات مکان مربوط به جایی که در تصویر چهرهها هستند را دارید.
سخن تکمیلی
کارایی Cloud Vision بیشتر از این مطالبی که در این مقاله گفته شد، است. از این رو ما سعی کردیم تا بهترین و جالبترین آن را به شما ارائه دهیم. اگر انجام هر یک از مراحل مشکل یا ایرادی داشتید، میتوانید آن را در گوگل جستجو کرده یا از کارشناسان طراحی سایت در مشهد ما کمک بگیرید.