מדריך Semalt בנושא הרחבת מגרד עבור Chrome

כדי שכל עסק יוכל לשרוד ובסופו של דבר לצמוח, יש להקפיד על מתחרים וסיכונים שונים. קבלת החלטות על סמך נתונים אנליטיים היא דרך בטוחה לשכוח מהבעיות הללו. ניתן לרכוש נתונים כאלה באמצעות גרוטאות נתונים. כאן נכנס סיומת מגרד קלה עבור Chrome: זה לא רק יאפשר את תהליך קטיף הנתונים אלא גם יאפשר גירוד בדרכים ללא הגדרות מסובכות.

כיצד להשתמש במגרד

    1. הדבר הראשון שעליך לעשות הוא להתקין את התוסף, אז עבור לחנות האינטרנט של כרום, חפש "מגרד" ולחץ על הוסף ל- Chrome.

    2. נווט לאתר שאתה מתכוון לגרד ממנו נתונים , סמן את הערך שאתה מעוניין בו על ידי הדגשתו. לחץ באמצעות לחצן העכבר הימני עליו ובחר "גרד דומה" בתפריט שיופיע.

    3. פעולה זו תפעיל חלון מסוף מגרד נפרד. כאן תראה רשימה של הנתונים המגרדים .

    4. לשמירת התוכן, לחץ על "שמור במסמכי גוגל", זה ייצא אוטומטית את הנתונים לגיליון אלקטרוני של גוגל.

גירוד מורחב

במקרה שאתה מתכנן לגרד נתונים נוספים, תוכל להשתמש בגישה המתקדמת. שימו לב, יהיה הרבה יותר קל לעבוד עם הכלי אם יש לכם קצת ידע ב- HTML. נניח שרצית לגרד נתונים ממקור שיש בו ארכיב על סמך נתוני סדרות זמן. במקרה כזה, אם תנסו את השיטה שתוארה לעיל, תקבלו את הנתונים המטורבלים.

כדי לפתור בעיה זו, אתה יכול להשתמש בשפת שאילתת HTML ו- XML המכונה XPath. מה זה עושה? XPath מזהה נתונים לגבי האלמנטים השונים הכלולים בכל בחירה. להלן מדריך כיצד להתמודד עם זה:

1. עבור אל קונסולת המגרד, בצד שמאל למעלה עליכם לשים לב לכפתור "XPath", לחץ עליו והמשיך להרכיב את הטבלה הראשונית.

2. עליכם לכתוב את ה- XPath עבור הרכיב הנכון. ה- XPath הנוכחי הכולל את כל המידע יוצג בתבנית כמו זו "// div [3] / div [3] / div [2] / div". האלמנטים <div> יוכרו במסמך HTML על ידי המחשב.

3. כדי להפריד בין הנתונים המוכרים, עליכם להשתמש בעמודות המגרד. לשם כך עליכם לחפש את סוגי המידע השונים שיש ברשותכם. תלוי בנתונים שאתה מגרד יתכן שיש לך כותרות. כותרות אלה קיימות לצד כל מערך נתונים. הם מלווים בתג, במקרה זה, תג <b>.

4. השתמש באלמנט inspect אתר והוסף את התג <b> ל- XPath שלך. עכשיו אתה יכול לתייג את העמודה הראשונה הזו כ"עמודת הכותרת "שכן היא תפרט את הכותרות. המשך ליצור XPaths שונים עבור כל עמודה שאתה זקוק להם.

5. לחץ על הגרד והסיומת תאסוף אוטומטית את הנתונים ותארגן אותם בעמודות השונות שקבעת.