ווי צו קריכן אַ גרויס פּלאַץ און עקסטראַקט דאַטן מיט די SEO ספּיידער פון סקרימינג פראָג

סקרימינג פראָג סעאָ ספּיידער

מיר איצט הילף עטלעכע קלייאַנץ מאַרקעטאָ מייגריישאַנז. ווי גרויס קאָמפּאַניעס נוצן ענטערפּרייז סאַלושאַנז ווי דאָס, עס איז ווי אַ שפּין וועב וואָס וויווז זיך אין פּראַסעסאַז און פּלאַטפאָרמס איבער יאָרן ... ביז די פונט אַז קאָמפּאַניעס טאָן ניט אַפֿילו וויסן יעדער רירעוודיק פונט.

מיט אַן אָטאַמיישאַן פּלאַטפאָרמע פֿאַר אָפּזעצערייַ פֿאַרקויף ווי מאַרקעטאָ, פאָרמס זענען די פּאָזיציע פונט פון דאַטן איבער זייטלעך און לאַנדינג בלעטער. קאָמפּאַניעס אָפט האָבן טויזנטער פון בלעטער און הונדערטער פארמען איבער זייער זייטלעך וואָס דאַרפֿן צו זיין יידענאַפייד פֿאַר דערהייַנטיקן.

א גרויס געצייַג פֿאַר דעם איז סקרימינג פראָג ס סעאָ ספּיידער... טאָמער די מערסט פאָלקס פּלאַטפאָרמע אין די מאַרק פֿאַר קראָלינג, אַדאַטינג און יקסטראַקטינג דאַטן פון אַ פּלאַץ. דער פּלאַטפאָרמע איז שטריך-רייַך און אָפפערס הונדערטער פון אָפּציעס פֿאַר כּמעט יעדער אַרבעט איר דאַרפֿן.

סקרימינג פראָג סעאָ ספּיידער: קריכן און עקסטראַקט

א שליסל שטריך פון Screaming Frog SEO Spider איז אַז איר קענען דורכפירן קאַסטאַמייזד יקסטראַקשאַנז באזירט אויף רעגעקס, XPath, אדער CSSPath ספּיסיפיקס. דאָס איז גאָר נוציק ווייַל מיר וועלן צו קריכן די זייטלעך פון דעם קליענט און קאָנטראָלירן און כאַפּן די MunchkinID און FormId וואַלועס פֿון בלעטער.

עפענען די געצייַג קאָנפיגוראַטיאָן> קאַסטאַם> יקסטראַקשאַן צו ידענטיפיצירן עלעמענטן וואָס איר ווילט צו עקסטראַקט.

סקרימינג פראָג מנהג יקסטראַקשאַן

די יקסטראַקשאַן פאַרשטעלן אַלאַוז כמעט אַנלימאַטאַד דאַטן זאַמלונג:

סקרימינג פראָג סעאָ ספּיידער יקסטראַקשאַן כּללים

רעגעקס, XPath און CSSPath יקסטראַקשאַן

פֿאַר די MunchkinID, די ידענטיפיער איז ליגן אין די פאָרעם שריפט וואָס איז ין דער בלאַט:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

מיר דעמאָלט צולייגן אַ רעגעקס הערשן צו כאַפּן דעם שייַן פֿון די שריפט קוויטל וואָס איז ינסערטאַד אין די בלאַט:

Regex: ["']id["']: *["'](.*?)["']

פֿאַר די פאָרם שייַן, די דאַטן זענען אין אַ אַרייַנשרייַב קוויטל אין די מאַרקעט פאָרעם:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

מיר צולייגן אַן XPath הערשן צו כאַפּן דעם שייַן פֿון די פאָרעם וואָס איז ינסערטאַד אין די בלאַט. די XPath אָנפֿרעג זוכט אַ פאָרעם מיט אַ אַרייַנשרייַב מיט אַ נאָמען פון גוואַלדיק, און די יקסטראַקשאַן סאַוועס די ווערט:

XPath: //form/input[@name="formid"]/@value

סקרימינג פראָג סעאָ ספּיידער דזשאַוואַסקריפּט רענדערינג

אן אנדער גרויס אָפּציע פון ​​Screaming Frog איז אַז איר זענט נישט לימיטעד צו די HTML אויף דעם בלאַט, איר קענט אַרויסגעבן קיין דזשאַוואַסקריפּט וואָס וועט אַרייַנלייגן פארמען אין דיין פּלאַץ. ין קאַנפיגיעריישאַן> ספּיידער, איר קענט גיין צו די קוויטל רענדערינג און געבן דאָס.

סקרימינג פראָג סעאָ ספּיידער דזשאַוואַסקריפּט רענדערינג

דאָך עס נעמט אַ ביסל לענגער צו קריכן דעם פּלאַץ, אָבער איר וועט באַקומען פארמען וואָס זענען רענדערד קליענט-זייַט דורך דזשאַוואַסקריפּט און פארמען וואָס זענען ינסערטאַד סערווער-זייַט.

כאָטש דאָס איז אַ זייער ספּעציפיש אַפּלאַקיישאַן, דאָס איז ינקרעדאַבלי נוציק ווען איר אַרבעט מיט גרויס זייטלעך. איר וועט לעגאַמרע וועלן קאָנטראָלירן ווו דיין פארמען זענען עמבעדיד איבער די פּלאַץ.

אראפקאפיע סקרימינג פראָג סעאָ ספּיידער

וואָס טאָן איר טראַכטן?

דעם פּלאַץ ניצט אַקיסמעט צו רעדוצירן ספּאַם. לערן ווי דיין קאָמענטאַר דאַטע איז פּראַסעסט.