מידענות

From Reut Wiki

אנו חווים את מירב העבודה ביום דרך השימוש בגוגל. אם כך אנו חווים את העולם, אזי ננסה להפיק ממנו את המיטב, מעבר לחיפוש מילולי פשוט.

רקע - מנוע החיפוש וגוגל

ככל שרשת האינטרנט צמחה, כך גם הדפים של האתרים החלו להתרבות. בשנות ה-90', הנסיון לעשות סדר כדי למצוא משהו באינסופיות של המידע עבד בשתי דרכים:

  • הזנה ידנית - רעיון אחד היה לייצר עץ קטגורי או חיפוש לפי הזנה ידנית. למשל, yahoo החזיקה עץ קטגורי עד ראשית שנות ה-2000, שאותו אנשים הכניסו ידנית אל תוך מערכות החיפוש. הבעיה היתה שהיה 'באפר' של אנושי, ואי אפשר היה לייצג את כל התכנים שבתוך האתרים, בעיקר כותרות.
  • זחלן, crawler - במהלך שנות ה-90' התחילו להתפתח טכנולוגיות שאיפשרו למחשבים לזחול בעצמם מלינק ללינק וללמוד מה יש באתרים. הטכנולוגיה הזו ייצרה כמויות של מידע והשאלה שעלתה היתה מצד אחד כיצד להתמודד במהירות עם כמויות המידע שנאגרות כך במאגרי מנוע החיפוש, וכיצד להציג את הלינקים הכי רלוונטיים בחיפוש.

הרעיון פורץ הדרך של גוגל היה כפול - הם יצרו אלגוריתם שדירג את התוצאה לפי כמות ורמת הקשרים בין האתרים השונים והוסיפו לזחלן גם העתקה של דפי האינטרנט כמות שהם ואחסונם על השרתים הפנימיים שלהם. באופן זה הם יצרו גם אלגוריתם שמדרג את איכות התשובות וגם אינדקס שאפשר חיפוש פנימי מהיר מאוד (במקום לחפש באינטרנט עצמו). למעשה הם העתיקו את כל האינטרנט אליהם. וכך, גוגל לא השאירה סיכוי למתחרים שמאז עליית גוגל לאוויר (2001) נפלו כולם. מאז הם שידרגו בכמה אופנים את דרכי החיפוש.

גוגל היא חברה עסקית שעושה כסף מפרסומות בדרכים מגוונות, פרסומות סמויות ולא סמויות. השירותים השונים של גוגל, כוללים את יוטיוב, ג'ימייל, בלוגר וכן יכולת של שליטה כמעט מוחלטת בפרופיל האישי של המחפש. יש בזה בעייתיות מאוד גדולה כשאתה רוצה לצאת מהמעגל הרגיל שלך. בעיה נוספת, אבל פתירה, היא deep web - אתרים ללא קישוריות לאתרים אחרים כלל, שלא יעלו אצלך לעולם בחיפוש של גוגל.

צריך לשים לב שגוגל מעלימים את אפשרויות החיפוש מתקדם וזה מצריך לדעת לשאול את גוגל את השאלה הנכונה כדי לקבל את המידע בו חפצים. למשל, אם הגעת למקום ש"לא נמצאו תוצאות" זה סימן לכך שהשאלה שנשאלה היא טובה דיה אבל דורשת שינוי במרכיבים.

שלב בפיתוח הידע

חיפוש מידע יכולת להתרחש בכל שלב של העבודה במכון - בפיתוח ידע ובהשפעה. אף על פי כן, הרלוונטיות המרכזית שלו היא במהלך טרנספר 2 שבו אנו יוצאים החוצה להרחיב את הענן מטרנספר 1. אבל - גוגל הוא לא המקום האולמיטיבי, מאחר והוא נותן לנו תמיד את מה שאנחנו מחפשים, ואת מה שאנחנו מחפשים מילולית. המשמעות היא שאם אנחנו מחפשים את השונה, את האחר, יקשה עלינו מאוד למצוא אותו בחיפוש אחד. לכן, כאשר מחפשים נושא, זהו סוג של חיפוש מתגלגל, קרי - יציאה החוצה, חיפוש וחזרה. המלל כאן משמעותי מאוד. השאלה היא איך חוצבים במידע הלא גלוי.

הקושי הגדול של עולם ה-unknown unknown הוא שאין לך מילים כדי להתחיל לחפש. בעולם בלי מחשב יוצאים למסע. אם הולכים לספרייה רגילה, הספר יכל להתקיים רק במדף אחד, אלא אם כן יש שני ספרים. לעומת זאת קישורית יכולה להיקשר למאמר במאות כיוונים.

כלים ספציפיים

הוראות יעילות לחיפוש אפקטיבי כדאי לעיין במצגת המצורפת

  • בגוגל ניתן לכתוב את המילה or| ובעברית את או.וזה יתן לנו שתי אופציות.
  • אם כותבים מלל עם סימון של (-) לפני מילה שאני לא רוצה לראות תופעה שלה, זה יוריד את המילה.
  • סוגים של קבצים: אם מחפשים קובץ בפורמט מסוים, למשל - רק pdf - יש לכתוב לפני החיפוש filetype, את הפורמט אותו מחפשים.

מצגת

Google Tips & tricks

קובץ:PictureFileName.jpg
כיתוב תמונה

'Using Boolean 'OR

It’s more likely that you want to search for websites that match either “Father Christmas” or “Santa Claus”, in which case you have to explicitly tell Google that by including the Boolean OR in your search: "Father Christmas" OR "Santa Claus" Perfect. Now every result contains one or the other jolly little man. Now consider the following search: "World Cup" (soccer OR football) If you prefer, you can replace the OR with a pipe character: "World Cup" (soccer | football) Remember that this means “Give me results that match the terms “World Cup” and also contain either soccer or football“.

A more complex example with phrase and Boolean searches

Here’s one last example to show you how specific you can be with just phrase and Boolean searches: Japan "English teacher" "((Nick OR Nicholas) (Ramsay OR Ramsey))" This means the results must contain one of the following:

  • Japan, English teacher, Nick Ramsay
  • Japan, English teacher, Nick Ramsey
  • Japan, English teacher, Nicholas Ramsay
  • Japan, English teacher, Nicholas Ramsey

Remove unwanted results with negation

This lesson introduces negation, i.e. using a minus sign (-) to specify terms you don’t want to appear in your search results. This can be useful when your results are cluttered with unrelated websites. Consider these examples: Note: There should be a space before the minus sign, but not after. Ice Age -movie Despite Ice Age being a popular movie for kids, if you want information on the real ice age, you should remove the word “movie”. Japanese cars -used Searching for Japanese cars brings up a bunch of websites selling used cars. If you’re just interested in learning about Japanese cars, remove the word “used” from your results. football -nfl -american For English football, or soccer, do a search for results that don’t contain “NFL” or “American”. "birthday cards" -free -ecard Wrapping “birthday cards” in double quotes will make sure all the results contain exactly that phrase. Of course, if you’re looking to buy a traditional birthday card, you don’t want results containing “free” or “Ecard”.

What words does Google ignore?

There doesn’t seem to be a public list of Google stop words available (although I did find this), but words like the, is, are, that, on, in and with are very likely to be ignored. Numbers and question words, too, seem to be considered as stop words. Examples of searches with and without stop words All these searches return (nearly) the same results: Japanese Prime Minister

  • The Japanese Prime Minister
  • How is the Japanese Prime Minister?
  • Who is the Japanese Prime Minister?
  • Where is the Japanese Prime Minister?
  • Was the Japanese Prime Minister in on it?
  • Where is the Japanese Prime Minister from?
  • What was the Japanese Prime Minister on about?
  • Will this be from the Japanese Prime Minister?
  • Why and when to be the Japanese Prime Minister
  • Is this by the Japanese Prime Minister or is that?

If you’re the kind of person who types questions into Google, hopefully you can now see that using stop words is pointless (at least in these examples) and you’d be able to speed up your searches without them. For example, if you really want to know where the Japanese prime minister is from, you’d be better off searching with: birthplace Japanese Prime Minister

How to include stop words in a Google search

What if you really need to include stop words in your search? Well, in the last lesson, I showed you how to exclude words from your search results using negation. We did that by adding a minus sign (-) to the front of the word we wanted to exclude. The opposite is called Explicit Inclusion, and we use a plus sign (+) to forcibly include words in our searches. For example: +the cars If you didn’t include the stop word, you’d get results about automobiles. Using Explicit Inclusion however, you get results for the American rock band from the 70’s, The Cars.

Is a phrase search better?

Usually, yes. In our example above, we are telling Google to return pages that contain the words the and cars, but not neccessarily together or in that order. To improve our results, we want to see those words back-to-back, so we’d be better off using a phrase search, i.e.: "the cars" A phrase search gives results contaiing the exact phrase searched for, including any stop words. There are times when explicit inclusion is helpful though. A search for king will return pages for magazines, games and radio stations called King. A search for +the king will give you results for Elvis Presley, books, movies and burgers, instead. Google is case insensitive. You can search for apple, APPLE, Apple, or even aPpLe and get the same results with each word

Google Speed-Search Lesson #6 – Wildcards

Here’s part six of my Google Speed-Search series. In this lesson, we’ll use wildcards to speed up our searches. A wildcard in Google is represented by an asterisk (*) and used instead of a single word. Consider this search: "Mount Fuji is * high" This phrase search forces Google to return web pages with the exact phrase above, but replacing the wildcard with any word. Here are some examples of what this search returns:

  • Mount Fuji is 3776 meters high
  • Mount Fuji is 12377 feet high
  • Mount Fuji is 3.8 km high
  • Mount Fuji is 3066 metres high

That last one proves you shouldn’t believe everything you read on the internet!

Using multiple wildcards

Each instance of the wildcard represents one word (numbers don’t count as shown above). Take a look at these examples with real Google results below each: "ten * bottles sitting on the wall"

  • Ten green bottles sitting on the wall

"ten * * sitting on the wall"

  • Ten green bloggers sitting on the wall
  • Ten green bottles sitting on the wall

"ten * * * on the wall"

  • Ten green bottles hanging on the wall
  • Ten green bottles standing on the wall

"ten * * * * the wall"

  • Ten green bottles hanging on the wall
  • Ten years ago, I daresay, The Wall Street Journal…
  • …grew steadily for ten years until we hit the wall

A little creativity can find you what you’re looking for

The Google wildcard is one of my favorite speed-search tricks. You can use it to find song lyrics, such as… "will * * * me * you * * me * I'm *" (Try this one in Google!) Or even to find the unanswerable… "the secret of life is *"

Google as a calculator

Did you know you can use Google as a calculator? Using either math or plain English, just search with your query, and the Big G will give you the answer! Examples:

  • 97.7*60
  • 4^16
  • sqrt(4096)
  • 2435 plus 4357
  • 24 times 35

Using Google to convert measurements

Google can also be used for measurement conversion. This is very handy for converting between imperial and metric, and is so much faster than searching for a dedicated website and using that. Examples:

  • 140kgs in stone
  • 6.4ft in centimeters
  • 60 km in miles

Google for currency conversion

If you live in Japan, you’re probably converting yen to dollars or pounds and back again quite regularly. You might even use a website like xe.com, but did you know you could do it all in Google? Examples:

  • 17 USD in yen
  • 5000 yen in Chinese money
  • 2.2 USD per gallon in GBP per liter

Using Google as a dictionary

When you’ve lived in Japan a long time, you’ll start to forget how to spell English words, and even forget the meaning of some of them! If you are like me, you’ll absolutely love Google’s define: syntax. Examples:

  • define: metabolic syndrome
  • define: NHK
  • define: takoyaki

Google as a know-it-all smarty pants!

Although Google as a search engine typically points you to websites that can answer your questions, it occasionally likes to show off and just tell you the answers without you needing to visit any websites at all! Try these:

  • population of Japan
  • temperature in Tokyo
  • time in Calgary
  • currency of Malaysia
  • weather in Nagoya
  • president of France

End.