آیا تا به حال شده که دو اسم شبیه به هم ولی کمی متفاوت داشته باشید؟ مثلاً “علی رضا” و “علیرضا”؟ یا “سارا” و “ساره”؟ خب، کامپیوترها هم گاهی اوقات با این مشکل روبرو می‌شوند! اما نگران نباشید، AWS (که یک غول بزرگ در دنیای کامپیوتر است) یک هدیه جدید به نام “AWS Entity Resolution” داده که به کامپیوترها یاد می‌دهد چطور این اسم‌های شبیه به هم را تشخیص دهند. بیایید با هم ببینیم این هدیه جدید چکار می‌کند!,Amazon


آیا تا به حال شده که دو اسم شبیه به هم ولی کمی متفاوت داشته باشید؟ مثلاً “علی رضا” و “علیرضا”؟ یا “سارا” و “ساره”؟ خب، کامپیوترها هم گاهی اوقات با این مشکل روبرو می‌شوند! اما نگران نباشید، AWS (که یک غول بزرگ در دنیای کامپیوتر است) یک هدیه جدید به نام “AWS Entity Resolution” داده که به کامپیوترها یاد می‌دهد چطور این اسم‌های شبیه به هم را تشخیص دهند. بیایید با هم ببینیم این هدیه جدید چکار می‌کند!

تصور کنید شما یک دفترچه تلفن خیلی بزرگ دارید و در آن اسم تمام دوست‌هایتان نوشته شده. بعضی وقت‌ها ممکن است اسم یک نفر را اشتباه بنویسید، مثلاً به جای “مریم” بنویسید “مریمی”. یا شاید اسم دو نفر شبیه هم باشد، مثلاً “رضا احمدی” و “رضا احمدی پور”. اگر بخواهیم این دفترچه تلفن بزرگ را مرتب کنیم و ببینیم کدام اسم‌ها به هم مربوط می‌شوند، کار خیلی سختی می‌شود!

AWS Entity Resolution دقیقاً برای همین کار ساخته شده است. این ابزار مثل یک کارآگاه خیلی باهوش برای کامپیوترهاست! کارآگاه‌هایی که می‌توانند اسم‌های شبیه به هم را پیدا کنند، حتی اگر کمی با هم فرق داشته باشند.

اما چطور این کار را انجام می‌دهد؟ AWS Entity Resolution از سه روش جالب و مخصوص استفاده می‌کند:

  1. لوینشتاین (Levenshtein): جادوی تغییر دادن!

    تصور کنید می‌خواهید کلمه “سیب” را به “سیب زمینی” تبدیل کنید. چقدر باید حرف به آن اضافه کنید؟ یا مثلاً اگر کلمه “گربه” را به “گر به” بنویسید، چقدر اشتباه شده؟ جادوگر لوینشتاین دقیقاً همین کار را می‌کند! او می‌شمارد که برای تبدیل شدن یک کلمه به کلمه دیگر، چند تا حرف باید اضافه، کم یا عوض شود. مثلاً برای تبدیل “علی” به “علیرضا” باید دو حرف “ر” و “ی” اضافه شود، پس لوینشتاین می‌گوید این دو اسم زیاد شبیه هم نیستند. اما برای تبدیل “سارا” به “ساره”، فقط یک حرف “ا” به “ه” تبدیل شده، پس لوینشتاین می‌گوید این دو اسم خیلی شبیه هم هستند!

  2. کسینوس (Cosine): زاویه دوستی بین کلمات!

    این یکی کمی شبیه ریاضیات است، اما فکر کنید کلمه‌ها هم برای خودشان دوستانی دارند. کسینوس می‌آید و می‌بیند که کلمه‌ها چقدر شبیه به هم حرف دارند. مثلاً اگر در لیستی از کلمات، کلمه‌های “ماشین” و “اتومبیل” باشند، کسینوس می‌بیند که هر دو درباره یک چیز صحبت می‌کنند و کلمه‌های مشابهی هم در خودشان دارند. پس می‌گوید این دو کلمه خیلی با هم دوست هستند. اگر دو کلمه هیچ حرف مشترکی نداشته باشند، کسینوس می‌گوید این دو کلمه خیلی از هم دور هستند و مثل غریبه‌ها هستند!

  3. ساوندکس (Soundex): شبیه به هم صدا دادن!

    بعضی وقت‌ها اسم‌ها وقتی تلفظ می‌شوند، شبیه به هم صدا می‌دهند، حتی اگر حرف‌هایشان فرق کند. مثلاً “محمد” و “محمت” هر دو صدای “م” و “ح” و “م” را دارند. ساوندکس می‌آید و هر کلمه را به یک کد صوتی تبدیل می‌کند. اگر دو کلمه کد صوتی شبیه به هم داشته باشند، یعنی موقع تلفظ شبیه به هم هستند، پس ساوندکس می‌گوید این دو اسم احتمالاً یک نفر هستند! این مثل این است که شما اسم دوستتان را با صدای بلند بگویید و او متوجه شود که شما او را صدا می‌زنید، حتی اگر کمی صدایتان خش‌دار باشد!

حالا این سه تا جادوگر با هم چکار می‌کنند؟

AWS Entity Resolution این سه روش را با هم ترکیب می‌کند تا بتواند با دقت بیشتری بفهمد کدام داده‌ها به هم مربوط می‌شوند. مثلاً، اگر در یک لیست اسم “خانم احمدی” و در لیست دیگر “خانم احمدی پور” باشد، و در لیست اول شماره تلفن “0912xxxx” و در لیست دوم هم همان شماره تلفن باشد، AWS Entity Resolution با استفاده از روش‌های مختلف می‌فهمد که این دو نفر احتمالاً یک نفر هستند.

چرا این چیزها مهم هستند؟

  • پاکیزه کردن اطلاعات: مثل این است که تمام اسباب‌بازی‌هایتان را مرتب کنید و اسباب‌بازی‌های تکراری را کنار بگذارید. این ابزار به شرکت‌ها کمک می‌کند تا اطلاعاتشان را پاکیزه کنند.
  • پیدا کردن دوست‌های گم شده: شرکت‌ها ممکن است اطلاعات یک مشتری را در جاهای مختلف داشته باشند. این ابزار به آن‌ها کمک می‌کند تا تمام اطلاعات مربوط به یک مشتری را پیدا کنند و او را بهتر بشناسند.
  • کشف رازها: مثلاً ممکن است در یک لیست، اطلاعات یک بیمار با نام “رضا” و در لیست دیگر اطلاعات یک بیمار دیگر با نام “ر. احمدی” باشد. این ابزار می‌تواند این دو را به هم ربط دهد و به پزشکان کمک کند تا بیماری را بهتر درمان کنند.

پس، AWS Entity Resolution با استفاده از جادوگرهای لوینشتاین، کسینوس و ساوندکس، به کامپیوترها یاد می‌دهد که چطور با اسم‌های شبیه به هم کنار بیایند و اطلاعات را بهتر مرتب کنند. این یک قدم بزرگ برای کمک به کامپیوترهاست تا هوشمندتر شوند و کارهای بزرگ را برای ما انجام دهند! شاید روزی خود شما هم بتوانید ابزارهای این چنینی بسازید که به کامپیوترها کمک کند دنیا را بهتر درک کنند!


AWS Entity Resolution launches advanced matching using Levenshtein, Cosine, and Soundex


هوش مصنوعی اخبار را ارائه کرد.

سوال زیر برای دریافت پاسخ از Google Gemini استفاده شد:

در 2025-07-30 13:47، Amazon ‘AWS Entity Resolution launches advanced matching using Levenshtein, Cosine, and Soundex’ را منتشر کرد. لطفاً یک مقاله مفصل با اطلاعات مرتبط، به زبانی ساده که کودکان و دانش‌آموزان بتوانند بفهمند، بنویسید تا کودکان بیشتری به علم علاقه‌مند شوند. لطفاً فقط مقاله را به زبان فارسی ارائه دهید.

دیدگاهتان را بنویسید