
آیا تا به حال شده که دو اسم شبیه به هم ولی کمی متفاوت داشته باشید؟ مثلاً “علی رضا” و “علیرضا”؟ یا “سارا” و “ساره”؟ خب، کامپیوترها هم گاهی اوقات با این مشکل روبرو میشوند! اما نگران نباشید، AWS (که یک غول بزرگ در دنیای کامپیوتر است) یک هدیه جدید به نام “AWS Entity Resolution” داده که به کامپیوترها یاد میدهد چطور این اسمهای شبیه به هم را تشخیص دهند. بیایید با هم ببینیم این هدیه جدید چکار میکند!
تصور کنید شما یک دفترچه تلفن خیلی بزرگ دارید و در آن اسم تمام دوستهایتان نوشته شده. بعضی وقتها ممکن است اسم یک نفر را اشتباه بنویسید، مثلاً به جای “مریم” بنویسید “مریمی”. یا شاید اسم دو نفر شبیه هم باشد، مثلاً “رضا احمدی” و “رضا احمدی پور”. اگر بخواهیم این دفترچه تلفن بزرگ را مرتب کنیم و ببینیم کدام اسمها به هم مربوط میشوند، کار خیلی سختی میشود!
AWS Entity Resolution دقیقاً برای همین کار ساخته شده است. این ابزار مثل یک کارآگاه خیلی باهوش برای کامپیوترهاست! کارآگاههایی که میتوانند اسمهای شبیه به هم را پیدا کنند، حتی اگر کمی با هم فرق داشته باشند.
اما چطور این کار را انجام میدهد؟ AWS Entity Resolution از سه روش جالب و مخصوص استفاده میکند:
-
لوینشتاین (Levenshtein): جادوی تغییر دادن!
تصور کنید میخواهید کلمه “سیب” را به “سیب زمینی” تبدیل کنید. چقدر باید حرف به آن اضافه کنید؟ یا مثلاً اگر کلمه “گربه” را به “گر به” بنویسید، چقدر اشتباه شده؟ جادوگر لوینشتاین دقیقاً همین کار را میکند! او میشمارد که برای تبدیل شدن یک کلمه به کلمه دیگر، چند تا حرف باید اضافه، کم یا عوض شود. مثلاً برای تبدیل “علی” به “علیرضا” باید دو حرف “ر” و “ی” اضافه شود، پس لوینشتاین میگوید این دو اسم زیاد شبیه هم نیستند. اما برای تبدیل “سارا” به “ساره”، فقط یک حرف “ا” به “ه” تبدیل شده، پس لوینشتاین میگوید این دو اسم خیلی شبیه هم هستند!
-
کسینوس (Cosine): زاویه دوستی بین کلمات!
این یکی کمی شبیه ریاضیات است، اما فکر کنید کلمهها هم برای خودشان دوستانی دارند. کسینوس میآید و میبیند که کلمهها چقدر شبیه به هم حرف دارند. مثلاً اگر در لیستی از کلمات، کلمههای “ماشین” و “اتومبیل” باشند، کسینوس میبیند که هر دو درباره یک چیز صحبت میکنند و کلمههای مشابهی هم در خودشان دارند. پس میگوید این دو کلمه خیلی با هم دوست هستند. اگر دو کلمه هیچ حرف مشترکی نداشته باشند، کسینوس میگوید این دو کلمه خیلی از هم دور هستند و مثل غریبهها هستند!
-
ساوندکس (Soundex): شبیه به هم صدا دادن!
بعضی وقتها اسمها وقتی تلفظ میشوند، شبیه به هم صدا میدهند، حتی اگر حرفهایشان فرق کند. مثلاً “محمد” و “محمت” هر دو صدای “م” و “ح” و “م” را دارند. ساوندکس میآید و هر کلمه را به یک کد صوتی تبدیل میکند. اگر دو کلمه کد صوتی شبیه به هم داشته باشند، یعنی موقع تلفظ شبیه به هم هستند، پس ساوندکس میگوید این دو اسم احتمالاً یک نفر هستند! این مثل این است که شما اسم دوستتان را با صدای بلند بگویید و او متوجه شود که شما او را صدا میزنید، حتی اگر کمی صدایتان خشدار باشد!
حالا این سه تا جادوگر با هم چکار میکنند؟
AWS Entity Resolution این سه روش را با هم ترکیب میکند تا بتواند با دقت بیشتری بفهمد کدام دادهها به هم مربوط میشوند. مثلاً، اگر در یک لیست اسم “خانم احمدی” و در لیست دیگر “خانم احمدی پور” باشد، و در لیست اول شماره تلفن “0912xxxx” و در لیست دوم هم همان شماره تلفن باشد، AWS Entity Resolution با استفاده از روشهای مختلف میفهمد که این دو نفر احتمالاً یک نفر هستند.
چرا این چیزها مهم هستند؟
- پاکیزه کردن اطلاعات: مثل این است که تمام اسباببازیهایتان را مرتب کنید و اسباببازیهای تکراری را کنار بگذارید. این ابزار به شرکتها کمک میکند تا اطلاعاتشان را پاکیزه کنند.
- پیدا کردن دوستهای گم شده: شرکتها ممکن است اطلاعات یک مشتری را در جاهای مختلف داشته باشند. این ابزار به آنها کمک میکند تا تمام اطلاعات مربوط به یک مشتری را پیدا کنند و او را بهتر بشناسند.
- کشف رازها: مثلاً ممکن است در یک لیست، اطلاعات یک بیمار با نام “رضا” و در لیست دیگر اطلاعات یک بیمار دیگر با نام “ر. احمدی” باشد. این ابزار میتواند این دو را به هم ربط دهد و به پزشکان کمک کند تا بیماری را بهتر درمان کنند.
پس، AWS Entity Resolution با استفاده از جادوگرهای لوینشتاین، کسینوس و ساوندکس، به کامپیوترها یاد میدهد که چطور با اسمهای شبیه به هم کنار بیایند و اطلاعات را بهتر مرتب کنند. این یک قدم بزرگ برای کمک به کامپیوترهاست تا هوشمندتر شوند و کارهای بزرگ را برای ما انجام دهند! شاید روزی خود شما هم بتوانید ابزارهای این چنینی بسازید که به کامپیوترها کمک کند دنیا را بهتر درک کنند!
AWS Entity Resolution launches advanced matching using Levenshtein, Cosine, and Soundex
هوش مصنوعی اخبار را ارائه کرد.
سوال زیر برای دریافت پاسخ از Google Gemini استفاده شد:
در 2025-07-30 13:47، Amazon ‘AWS Entity Resolution launches advanced matching using Levenshtein, Cosine, and Soundex’ را منتشر کرد. لطفاً یک مقاله مفصل با اطلاعات مرتبط، به زبانی ساده که کودکان و دانشآموزان بتوانند بفهمند، بنویسید تا کودکان بیشتری به علم علاقهمند شوند. لطفاً فقط مقاله را به زبان فارسی ارائه دهید.