ווי צו קריכן אַ גרויס פּלאַץ און עקסטראַקט דאַטן מיט די SEO ספּיידער פון סקרימינג פראָג

סקרימינג פראָג סעאָ ספּיידער

מיר איצט אַסיסטינג עטלעכע קלייאַנץ מאַרקעטאָ מייגריישאַנז. ווי גרויס קאָמפּאַניעס נוצן ענטערפּרייז סאַלושאַנז ווי דאָס, עס איז ווי אַ שפּין וועב וואָס וויווז זיך אין פּראַסעסאַז און פּלאַטפאָרמס איבער יאָרן ... ביז די פונט אַז קאָמפּאַניעס זענען נישט אַפֿילו אַווער פון יעדער טאָוטשפּאָינט.

מיט אַן אָטאַמיישאַן פּלאַטפאָרמע פֿאַר אָפּזעצערייַ פֿאַרקויף ווי מאַרקעטאָ, פאָרמס זענען די פּאָזיציע פונט פון דאַטן איבער זייטלעך און לאַנדינג בלעטער. קאָמפּאַניעס אָפט האָבן טויזנטער פון בלעטער און הונדערטער פארמען איבער זייער זייטלעך וואָס דאַרפֿן צו זיין יידענאַפייד פֿאַר דערהייַנטיקן.

א גרויס געצייַג פֿאַר דעם איז סקרימינג פראָג ס סעאָ שפּין... טאָמער די מערסט פאָלקס פּלאַטפאָרמע אין די מאַרק פֿאַר קראָלינג, אַדאַטינג און יקסטראַקטינג דאַטן פון אַ פּלאַץ. דער פּלאַטפאָרמע איז שטריך-רייַך און אָפפערס הונדערטער פון אָפּציעס פֿאַר כּמעט יעדער אַרבעט איר דאַרפֿן.

סקרימינג פראָג סעאָ ספּיידער: קריכן און עקסטראַקט

א שליסל שטריך פון Screaming Frog SEO Spider איז אַז איר קענען דורכפירן קאַסטאַמייזד יקסטראַקשאַנז באזירט אויף רעגעקס, XPath, אדער CSSPath ספּיסיפיקס. דאָס איז גאָר נוציק ווען מיר וועלן צו קריכן די זייטלעך פון די קליענט און קאָנטראָלירן און כאַפּן די MunchkinID און FormId וואַלועס פֿון בלעטער.

עפענען די געצייַג קאָנפיגוראַטיאָן> קאַסטאַם> יקסטראַקשאַן צו ידענטיפיצירן עלעמענטן וואָס איר ווילט צו עקסטראַקט.

סקרימינג פראָג מנהג יקסטראַקשאַן

די יקסטראַקשאַן פאַרשטעלן אַלאַוז כמעט אַנלימאַטאַד דאַטן זאַמלונג:

סקרימינג פראָג סעאָ ספּיידער יקסטראַקשאַן כּללים

רעגעקס, XPath און CSSPath יקסטראַקשאַן

פֿאַר די MunchkinID, די ידענטיפיער איז ליגן אין די פאָרעם שריפט וואָס איז ין דער בלאַט:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

מיר דעמאָלט צולייגן אַ רעגעקס הערשן צו כאַפּן דעם שייַן פֿון די שריפט קוויטל וואָס איז ינסערטאַד אין די בלאַט:

Regex: ["']id["']: *["'](.*?)["']

פֿאַר די פאָרם שייַן, די דאַטן זענען אין אַ אַרייַנשרייַב קוויטל אין די מאַרקעט פאָרעם:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

מיר צולייגן אַן XPath הערשן צו כאַפּן דעם שייַן פֿון די פאָרעם וואָס איז ינסערטאַד אין די בלאַט. די XPath אָנפֿרעג זוכט אַ פאָרעם מיט אַ אַרייַנשרייַב מיט אַ נאָמען פון גוואַלדיק, און די יקסטראַקשאַן סאַוועס די ווערט:

XPath: //form/input[@name="formid"]/@value

סקרימינג פראָג סעאָ ספּיידער דזשאַוואַסקריפּט רענדערינג

אן אנדער גרויס אָפּציע פון ​​Screaming Frog איז אַז איר זענט נישט לימיטעד צו די HTML אויף דעם בלאַט, איר קענט געבן קיין דזשאַוואַסקריפּט וואָס וועט אַרייַנלייגן פארמען אין דיין פּלאַץ. ין קאַנפיגיעריישאַן> ספּיידער, איר קענט גיין צו די קוויטל רענדערינג און געבן דאָס.

סקרימינג פראָג סעאָ ספּיידער דזשאַוואַסקריפּט רענדערינג

דאָך עס נעמט אַ ביסל לענגער צו קריכן דעם פּלאַץ, אָבער איר וועט באַקומען פארמען וואָס זענען רענדערד קליענט-זייַט דורך דזשאַוואַסקריפּט און פארמען וואָס זענען ינסערטאַד סערווער-זייַט.

כאָטש דאָס איז אַ זייער ספּעציפיש אַפּלאַקיישאַן, עס איז ינקרעדאַבלי נוציק ווען איר אַרבעט מיט גרויס זייטלעך. איר וועט לעגאַמרע וועלן צו קאָנטראָלירן ווו דיין פארמען זענען עמבעדיד איבער די פּלאַץ.

אראפקאפיע סקרימינג פראָג סעאָ ספּיידער

וואָס טאָן איר טראַכטן?

דעם פּלאַץ ניצט אַקיסמעט צו רעדוצירן ספּאַם. לערן ווי דיין קאָמענטאַר דאַטע איז פּראַסעסט.