ユーティリティ - 検索の記事一覧
画像からテキストまで。業務で使えるオープンソース(141)「検索」
今回のテーマは検索です。デスクトップ向けのWebで最もポピュラーな技術ではないでしょうか。検索はGoogleが手の届く範囲とそれ以外というくらい世界が異なって見える技術です。Googleの手の届かない世界ではアルゴリズムも異なりますし、求められる結果も異なるでしょう。そこで今回は検索の種類と、主なオープンソース・ソフト...
lookup - コンソールから検索サイトと検索条件を指定して、結果をウェブブラウザーに表示
lookup はPerl製のソフトウェアです。コマンドラインで検索サイトと検索条件を指定して実行すると、標準設定しているウェブブラウザーを起動して検索します。Webブラウザで検索する時、ついつい目的から脱線してしまうことがあります。このような誘惑に勝たなければならない場面でお手伝いをしてくれるソフトウェアです。## 主...
ALL SEEING EYE – Chromeブラウジング履歴を全文検索
オンラインの情報は大きく二つに分かれます。それは未知と既知の情報です。未知の情報を探すのはGoogleをはじめとするWeb検索エンジンが便利です。しかし既知の情報をいかに上手に探すかは今ひとつではないでしょうか。既知の情報は通常、一度はブラウジングしたサイトになります。そこで一度見た情報を後から探すというのは意外とうま...
使えるWebサービス・オープンソース(27)「類自画像検索」
今回のテーマは類似画像検索です。スマートフォンが流行るのにつれて、写真コンテンツは爆発的に増えています。テキストよりも画像の方が役立つケースも多く、写真コンテンツは今後も増え続けるでしょう。そこで求められるのは従来のテキスト検索ではない情報提供方法です。その一つ、画像を検索するための技術である類似画像検索を取り上げてみ...
LIRE - Java製の類似画像検索エンジン
Googleの類似画像検索を使うと、例えばどこかのサイトで見た画像のネタ元(さらに言えば加工前)の画像を探すことが出来ます。それによって改変を見破ったり、一次ソースにあたることが出来ます。それだけでなく、類似画像検索は色々な場面で役立つでしょう。大量にある写真の中から類似した写真を見つけ出せば、それだけで魅力あるコンテ...
BirdWatch – TwitterストリーミングAPIを使ったキーワード解析ツール
Twitterにはリアルタイムに大量のメッセージが送られています。大多数は取り立てて意味のないデータかも知れませんが、その中から役立つデータをピックアップするのは大変なことです。分析している間に次のデータがきてしまい、すぐにトレンドが変化してしまいます。そんなリアルタイムのTwitterトレンドビジュアル化をしてくれる...
近傍ツイート検索 - あるツイートの前後のツイートを検索
ああ、これは時間を忘れてしまいそう。Wikipediaを見ていて、ある事柄からリンクしている別な文書を見て、さらに深堀りして…と繰り返している間にいつの間にか時間が経ってしまっていた、なんて経験は誰しもがあるのではないでしょうか。そんな情報のドリルダウンは物事に深みを与えて、より広い視点で捉えられるようになるでしょう。...
Depstack – 投票ができる。使えるライブラリに出会えるサイト
プログラミング言語はライブラリが肝です。言語単体の魅力はもとより、使えるライブラリが十分にないと利用したいと思えないでしょう。各言語向けにライブラリを紹介するサイトがありますが、それらを一つにまとめあげてしまうのがDepstackです。Depstackでは有名なプログラミング言語のライブラリがたくさん揃っています。各プ...
Oktavia - Web上、クライアントサイドの検索エンジン
お、かなりパフォーマンスが高い!サイト内検索を作る際にまず思いつくのがサーバサイド内での検索です。また公開情報であればGoogleの検索エンジンを使う手もあります。今回はそのどちらでもない第三の選択肢、JavaScriptによるクライアントサイドの検索エンジンです。検索の難しさは何と言ってもインデックスの生成部分になる...
Simple GitHub Search - GitHub愛用者向け。ChromeからGitHubを一発検索
これはお勧め!プログラマーやデザイナーの方であればGitHubを検索する機会は多いと思います。特にGitHubで検索する場合は自分のプライベートなリポジトリも検索できるのでGoogleのWeb検索とは違ったメリットがあります。そんなGitHub検索を簡単にできるGoogle Chrome機能拡張がSimple GitH...
Ajaxを多用したサイトのWebクローラ対策にどうぞ「seoserver」
seoserverはnode/JavaScript製のオープンソース・ソフトウェア(BSD License)です。JavaScriptを多用してWebサイトを構築するようになると問題になるのがWeb検索対策です。特にAjaxを使うとコンテンツが殆どないページがクローリングされてしまって検索に引っかからなくなります。そこ...
ターミナルで使えるGoogle検索「Gisele」
GiseleはPHP製、WTFPLのソフトウェアです。Googleは2000年くらいの登場以後、最も信頼できる検索エンジンとしてずっと活用されています。そのデータを使えば面白い仕組みもできるでしょう。それを容易にしてくれるツールがGiseleです。オプションです。対応しているのはWeb検索、画像検索、ニュース検索になり...
クライアントサイドの全文検索エンジン「lunr.js」
lunr.jsはJavaScript製のオープンソース・ソフトウェア(MIT License)です。Webサイトを運営していて、煩雑な仕組みになりがちながらも実装を考えなければならないのが全文検索エンジンです。もし作ろうとしているのがWebアプリケーションであれば、いっそのことクライアントサイドで提供してみるのはいかが...
Solrを使う際にどうぞ。Ajaxベースの検索フロントエンド「AJAX Solr」
AJAX SolrはSolrのAjax検索インタフェースです。個人的にもWebサービスの検索エンジンとして使うことが増えてきているSolr。そんなSolrのフロントエンドとして使えるソフトウェアがAJAX Solrです。デモです。左側がフィルタ、右側に結果が表示されています。結果の全文を読むこともできます。フィルタ条件...
画面上にはないキーワードでも検索できるページ内検索「Cinnamon.js」
Cinnamon.jsはHTMLコードに検索キーワードを埋め込むことでよりユーザビリティの高いページ内検索を提供します。Webブラウザでページ内検索を行うことは多いと思いますが、あくまでも表面上のテキストに対してしか検索できません。その垣根を越えて、別なワードを仕込めるようにするのがCinnamon.jsです。Twit...
GitHubのリポジトリページにコード検索機能を追加「GitHub Code Search」
GitHub Code SearchはGitHubのプロジェクトページにソースコード検索機能を提供するユーザスクリプトです。GitHubをプロジェクトのコードリポジトリに利用しているプログラマーは多いと思いますが、さらにGitHubを便利にしてくれるUser Scriptを紹介します。GitHub Code Searc...
膨大なデータから最適な結果を得るための検索エンジン「Cloud Mining」
Cloud Miningはタグクラウドや全文検索を使った構造化データに向いた検索エンジンです。Webサイトで常に必要になるのが検索エンジンです。最近は全文検索エンジンが人気ですが、より大量の構造化データを検索するのに最適な検索エンジンとしてCloud Miningを紹介します。デモです。IMDBを解析した検索エンジンで...
正規表現を使った検索、置換インタフェース「dnGREP」
dnGREPは.NET 4.0を使ったGUIのGREPインタフェースです。置換に対応しています。Windowsにもデスクトップ検索がありますが、インデックスの負荷があって個人的には使っていません。それよりも指定したディレクトリ以下だけを検索してくれる方が便利です。そこで使ってみたいのがdnGREPです。インストーラーで...
業務で使えるオープンソース(50)「検索エンジン」
今回のテーマは検索エンジンです。Web検索と言えばGoogleやBingなどが有名ですが、自社のWebサービスや社内で組み込む場合はまた違ったニーズがあるでしょう。そこで今回は自社内外で使える検索エンジンを取り上げます。
オフラインでも使えるJavaScriptベースの全文検索エンジン「Fullproof」
FullproofはJavaScriptベースの全文検索エンジンです。高速に動作します。Webサイトのコンテンツが充実してきたら欲しくなるのが検索機能です。Google検索を使っても良いですが、ここではFullproofを紹介します。何とJavaScriptベースの全文検索エンジンです。色検索エンジン。動作は高速です。...