👈فول فایل فور یو ff4u.ir 👉

تشخیص پلاگاریسم به کمک گراف در متون فارسی wrd

ارتباط با ما

دانلود


تشخیص پلاگاریسم به کمک گراف در متون فارسی wrd
چکیده
تمرکز این پایان­نامه روی جستجوی شباهت­های مبتنی بر گراف، در متون مربوط به زبان­های طبیعی است. نیاز به یک روش قوی برای ارائه متون، مسئله مهمی در زمینه تشخیص پلاگاریسم است، ما در این پروژه با توجه به این نیاز، روشی قدرتمند را برای ارائه زبان طبیعی معرفی نموده و از آن در تشخیص پلاگاریسم بهره برده­ایم. برای این منظور مفهوم "فاصله اصلاح گراف" را بیان نموده و از آن برای محاسبه فاصله­ی بین دو گراف استفاده کرده­ایم. جملات توسط گراف­های وابستگی ارائه شده­اند که در آن­ها کلمات توسط وابستگی­هایشان به هم متصل شده­اند. گراف وابستگی ساختار گرامری جملات را استخراج می­کند. روش شباهت مبتنی بر گراف در مسئله تشخیص پلاگاریسم به کار برده شده است. مزیت اصلی ارائه مبتنی بر گراف، مربوط به توانایی این روش در تشخیص شباهت­های بین کلمات است.ارزیابی­ها نشان دادند که نتایج حاصل از گراف وابستگی نسبت به روش­های مقایسه مستقیم گراف­ها نتایج بهتری دارند. استفاده از فاصله اصلاح گراف برای مقایسه دو گراف منجر به بهبود نتایج گراف وابستگی می­شود و کارایی آن را بالا می­برد.
 کلیدواژه: فاصله اصلاح گراف، پردازش زبان طبیعی، گراف­های وابستگی، تشخیص پلاگاریسم
فهرست مطالب
مقدمه2
1-1 توضیح مسئله5
1-2 راه حلها6
1-3 مشکلات موجود در پیادهسازی الگوریتم6
1-4 ساختار پایاننامه7
پیشینهی تحقیق9
2-1 تشخیص پلاگاریسم9
2-2 ابعاد تشخیص پلاگاریسم12
2-2-1 روش مبتنی بر گرامر12
2-2-2 روشهای مبتنی بر معنا13
2-2-3 روشهای ترکیبی14
2-2-4 روش تشخیص پلاگاریسم خارجی14
2-3 روشهای محاسبه میزان شباهت گرافها15
2-3-1 روش بزرگترین زیرگراف مشترک - کوچکترین سوپرگراف مشترک15
2-3-2 روش مبتنی بر جستجوی فضای حالت17
2-3-3 روشهای احتمالی18
3-1 تشخیص پلاگاریسم23
3-1-1 تطبیق n گرام23
3-1-2 وزندهی عبارت23
3-1-3 تعمیم عبارت24
3-2 گرافهای وابستگی25
3-2-1 وابستگیها26
3-3 فاصله ویرایش گراف26
3-3-1 عملیات ویرایش26
3-3-2 مسئلهی انتساب27
3-3-3 ماتریس هزینه28
3-3-4 الگوریتمهای انتساب29
4-1 معماری32
4-2 پیشپردازش متن32
4-2-1 پیدا کردن جملات33
4-2-2 ریشهیابی کلمات34
4-2-3 تشکیل گراف وابستگی40
4-3 استخراج کاندیدا44
4-3-1 شاخصگذاری جمله45
4-3-2 استخراج جملات کاندیدا45
4-4 تحلیل جزئیات45
4-4-1 الگوریتم فاصله ویرایش دو گراف48
4-4-2 تشخیص پلاگاریسم مبتنی بر GEDارائه شده در این پروژه49
5-1 تشخیص پلاگاریسم جابجایی کلمات و تغییر ساختار جملات55
5-1-1 تغییرات ساختاری 10 درصدی56
5-1-2 تغییرات ساختاری 50 درصدی57
5-2-2 تغییرات ساختاری 100 درصدی59
5-2 تشخیص پلاگاریسم معنایی60
5-2-1 تغییرات معنایی 10 درصدی60
نتیجه گیری و پیشنهادات64
مراجع67
 جدول 4 - 1 : ساخت‌های زمان حال و امر [26]39
جدول 4 - 2 : ساخت‌های زمان‌ گذشته و مستقبل [26]39
جدول 4 - 3 : عملیات ویرایش برای تبدیل جمله 1 به جمله 247
 شکل 1- 1 : توپ توسط پسری به خارج از استادیوم شوت شد4
شکل 1- 2 : بازیکن توپ را به خارج از زمین شوت کرد4
شکل 3- 1 : مثال عملیات ویرایش برای دو گراف27
شکل 3- 2 : مسئله انتساب28
شکل 4-1 : مروری بر ماژولهای اصلی سیستم32
شکل 4-2 : فاز پیشپردازش متن33
شکل 4-3 : پیدا کردن جملات در متن34
شکل 4-4 : نمایش نودها در جملات و استخراج مفاهیم از جملات و وزن بین نودها که میزان شباهت بین جملات را مشخص میکند. T1، T2، ...، Tn نشان دهندهی عبارات است [11].42
شکل 4- 5 : ساختار نود شاخص برای مفاهیم جمله در گراف[11]44
شکل 4- 6 : فاز بازیابی کاندیدا44
شکل 4- 7 : فاز تحلیل جزئیات45
شکل 4- 8 : گرافهای وابستگی برای جملات 1 و 246
شکل 4- 9 : دو گراف همریخت48
شکل 4- 10 : الگوریتم بررسی شباهت دو جملهای که تشخیص داده شده است که ممکن است شبیه یکدیگر باشند50
شکل 5- 1 : مقایسه دو متن توسط الگوریتم اولیه54
شکل 5- 2 : مقایسه دو متن توسط الگوریتم بهبودیافته55
شکل 5- 3 : نمودار مقایسه تغییرات ساختاری 10 درصدی متون56
شکل 5- 4 : میانگین خروجی نرم افزار برای ساختاری 10 درصد57
شکل 5- 5 : نمودار مقایسه تغییرات ساختاری 20 درصدی متون58
شکل 5- 6 : میانگین خروجی نرم افزار برای ساختاری 20 درصد58
شکل 5- 7 : نمودار مقایسه تغییرات معنایی 100 درصد59
شکل 5- 8 : میانگین خروجی نرم افزار برای جابجایی 100 درصد60
شکل 5- 9 : نمودار مقایسه تغییرات معنایی 10 درصد61
شکل 5- 10 : میانگین خروجی نرم افزار برای معنایی 10 درصد61
 فصل اول
مقدمه
برخی افراد ممکن است خواسته یا نا­خواسته از کارهای محققان استفاده کنند در حالیکه حتی نامی از نویسنده­ی اصلی اثر ذکر نکرده باشند، این عمل پلاگاریسم نامیده می­شود. پلاگاریسم عمل عمدی یا غیر­عمدی کپی کردن یا استفاده از ایده­ها و کارهای دیگران است بدون آنکه اطلاعاتی درباره منبع اصلی ذکر شده باشد. بر اساس بررسی­های صورت گرفته بر روی موضوع پلاگاریسم و تعداد مقالات بیشمار مندرج در وب و انعکاس نگرانی از وقوع آن مشخص است که اکثر مراکز آموزشی و پژوهشی در صفحات الکترونیکی خود در اقصی نقاط جهان چه در کشورهای در حال رشد آسیا و افریقا، تحت تاثیر ناشران با سابقه مجلات پژوهشی و نیز حفظ حیثیت علمی مراکز خود به معرفی همه جانبه این پدیده ضد اخلاقی و ضد اجتماعی به عنوان یک جرم مبادرت کرده­اند. پلاگاریسم یک مشکلی در انجمن علمی است و به سرعت در حال رشد است، بدلیل آنکه داده و اطلاعات از بین اسناد الکترونیکی و اینترنت سریع و آسان از طریق کپی و درج از آن منابع بدست می­آید. این مشکل زمانی رخ می­دهد که محتوای اسناد غیرقانونی و بدون اجازه و بدون نقل قول پیدا شود که این مشکل به عنوان پلاگاریسم شناخته شده است و پلاگاریسم می تواند شامل طیف وسیعی از دستبردهای آگاهانه تا کپی کردن اتفاقی مطالب دیگران باشد. هدف اصلی این پایان­نامه بیان روش مبتنی بر گراف برای ارائه متن و استفاده از آن در تشخیص پلاگاریسم است. بخش­هایی که در ادامه این فصل می­آیند دلایل استفاده از این روش را بیان نموده و به شرح مسئله­ی تشخیص پلاگاریسم می­پردازند. به علاوه یک راه­ حل برای این مسئله ارائه می­دهند. در نهایت ساختار پایان نامه معرفی و مطالبی که در فصل­های بعدی به آنها پرداخته خواهد شد، مرور خواهند شد.
مسئله­ی پیدا کردن شباهت بین دو متن، یک مسئله معمول در زمینه­ی پردازش زبان­های طبیعی است. به منظور ارزیابی شباهت­ها بین دو متن، هر متن نیاز به روشی برای ارائه دارد. یک روش متن ساده است، که در آن یک لیست از کلمات، یک جمله را شکل می­دهند. متنِ ساده معمولا به دلیل سادگی مورد استفاده قرار می­گیرد، اما فاقد اطلاعات واضح راجع به ساختار گرامری است.
بعضی از جنبه­های زبان با استفاده از روش­های ارائه­ی ساختاری از قبیل گراف­های وابستگی که شامل کلمات متصل به هم است، بهتر ارائه می­شوند.
گراف­های وابستگی ساختار گرامری یک جمله را استخراج نموده، و به گستره­ی همان جمله محدود می­شوند. یکی از مزایای اصلی ارائه­ی مبتنی بر گراف این است که گراف­های وابستگی در بیشتر موارد حساس به ترتیب کلمات نیستند. این مزیت باعث می­شود که شباهت بین جملاتی که ترتیب کلمات در آنها به هم ریخته شده است، پیدا شود.
یک ارائه­ی قویتر پایه­های بهتری را برای مشخص کردن شباهت­ها در وضعیت­های پیچیده فراهم می­کند. دو جمله­ی ارائه شده در گراف وابستگی شکل­های 1-1 و 1-2 را در نظر بگیرید. انسان باید بتواند مشخص کند که این جملات دارای معانی یکسانی هستند. با این حال، تشخیص اتوماتیک شباهت این دو جمله به دلیل جایگزینی کلمات دچار مشکل خواهد شد. اگر از ارائه متن ساده استفاده شود، تنها کلمات مشترک "به"، "خارج"، "از"، "شوت" و "توپ" خواهند بود. کلمه­ی "شوت" و "توپ" تنها کلماتی هستند که منظور جمله را می­رسانند. با دقت در گراف­های وابستگی، واضح است که شباهت ساختاری بین جملات وجود دارد.
شکل 1- 1 : توپ توسط پسری به خارج از استادیوم شوت شد
شکل 1- 2 : بازیکن توپ را به خارج از زمین شوت کرد
با افزایش میزان دسترسی به متون موجود در وب، پلاگاریسم ساده و ساده­تر شده است. میزان زیادی از متون پلاگاریسم در زمینه­ی درسی و تحصیلی سال به سال افزایش پیدا می­کنند. در نتیجه، نیاز شدیدی به تشخیص خودکار پلاگاریسم احساس می­شود.
1-1 توضیح مسئله
مهم­ترین بخش این پایان­نامه پیاده­سازی یک الگوریتم برای محاسبه فاصله­ی اصلاح گراف است، که شباهت بین دو گراف را محاسبه می­کند. الگوریتم مبتنی بر محاسبه­ی تعداد عملیات ویرایشی مورد نیاز برای تبدیل یک گراف به گراف دیگر است[1]. هر عمل ویرایش یک هزینه­ی ویرایش دارد، که مشخص می­کند یک عمل چقدر هزینه می­برد.
تشخیص پلاگاریسم اتوماتیک یک زمینه­ی تحقیقاتی است که در اصل روی شباهت متنی بنا شده است. مسئله­ی بکارگیری شباهت متن مبتنی بر گراف برای تشخیص پلاگاریسم در سوال تحقیقی 1 بیان شده است.
سوال تحقیقی 1 : آیا شباهت مبتنی بر گراف، در یک فاصله اصلاح گراف مشخص، در تشخیص پلاگاریسم قابل بکارگیری و از لحاظ محاسباتی امکان­پذیر هست؟
سیستم­های تشخیص پلاگاریسم آزمایشی اغلب مبتنی بر ارائه­های ساده­تر متن، از قبیل تطبیق nگرام و مدل فضای بردار هستند [2 و 3]. در نتیجه، روش می­تواند نسبتا منحصر به فرد باشد. به دلیل منحصر بودن روش، بعضی از جزئیات پیاده­سازی تعریف شده نیستند. سوال تحقیقاتی 2 مسئله­ای را بیان می­کند که جزئیات الگوریتم را مشخص می­نماید.
سوال تحقیقی 2 : بهترین روش برای محاسبه­ی فاصله ویرایش گراف بین جملات، به ویژه از لحاظ هزینه­ی ویرایش و ارائه گراف در زمینه تشخیص پلاگاریسم چیست ؟
به منظور ارزیابی کارایی الگوریتم محاسبه فاصله­ی ویرایش گراف، کارایی آن در مقایسه با سیستم­های آزمایشی موجود مقایسه می­شود. سوال تحقیقی 3 مسئله­ی مقایسه­ی الگوریتم با روش­های موجود را مطرح می­کند.
سوال تحقیقی 3 : شباهت مبتنی بر گراف با سایر روش­ها در تشخیص پلاگاریسم، از قبیل بازیابی مبتنی بر اندیس و تطبیق nگرام، چگونه مقایسه می­شود؟

👇 تصادفی👇

خلاصه ی کتاب مبانی مدیریت دولتی 2 ( طاهره فیضی) + تستجامع الحوال و الاوصاف الاجنهدانلود پروژه کامل روستا کوچری گلپایگانحافظ صحت کلمات، اصالت غزلها (الف تا پایان ی)سیستم مکانیزه بیمه با رشنال رزبررسی و تشخیص نفوذ با استفاده از الگوریتم های داده کاوی WORDسنگی بر گوری-جلال آل احمدبررسی استعمال گلایسین و تیمار سالیسیلیک اسید بر خصوصیات مورفولوژیک گل اهار در شرایط تنش شوری ✅فایل های دیگر✅

#️⃣ برچسب های فایل تشخیص پلاگاریسم به کمک گراف در متون فارسی wrd

تشخیص پلاگاریسم به کمک گراف در متون فارسی wrd

دانلود تشخیص پلاگاریسم به کمک گراف در متون فارسی wrd

خرید اینترنتی تشخیص پلاگاریسم به کمک گراف در متون فارسی wrd

👇🏞 تصاویر 🏞