技術 - テキストの記事一覧
日本の文章はやはり縦書きが読みやすい「tategumi.js」
tategumi.jsはJavaScriptを使って文章を縦書き、右から左に読ませる文章に変換するライブラリ。tategumi.jsはJavaScript製のオープンソース・ソフトウェア。Webの文章は横書きが基本だ。日本語の場合は左から右に表示される。Webサイトは縦方向にスクロールするように作られているので、横方向...
仕様書やテクニカルドキュメント、書籍の執筆など。ライター向けヘルプツール「Writer's Tools」
Writer's ToolsはLibreOfficeやOpenOffice.orgで使えるライター向けのドキュメント作成ヘルプツール群。Writer's ToolsはLibreOffice/OpenOffice.org用のオープンソース・ソフトウェア。文章を書くのはとにかく書き進めれば良いというものではない。文字数や章...
複数言語に対応したテキスト読み上げアプリ「Type and Speak」
Type and Speakは入力したテキストを読み上げるAndroidアプリ。多数の言語に対応。Type and SpeakはAndroid製のオープンソース・ソフトウェア。海外旅行に行った際などに一番問題になるのは言語の問題ではないだろうか。ガイドブックには読み方は書いてあるが、どう発音するのかは分からない。伝えた...
.NETアプリケーションで形態素解析によるテキスト解析「NMeCab」
NMeCabは形態素解析エンジンの解析処理部分をC#に移植したソフトウェア。NMeCabはWindows用のオープンソース・ソフトウェア。インターネットの普及によってテキストコンテンツが爆発的に増えている。そんな中で注目が集まるのがテキスト解析だ。日本語のように漢字、ひらがな、カタカナがおり混ざった複雑な文章から意味を...
某表計算ソフトウェアの余計な変換が嫌いな方向けのCSVエディタ「reCsvEdit」
reCsvEditはシンプルなJava製のCSVエディタ。reCsvEditはJava製のオープンソース・ソフトウェア。CSVはシステムで用いることが多いフォーマットではないかと思われる。表計算ソフトウェアで作成したファイルをそのまま使っても良いが、CSVに変換すればテキストとして容易に使えるので便利なのだ。ファイルを...
GoogleのAPIを活用。平仮名を日本語変換するRubyライブラリ「Glitch IME」
Glitch IMEはGoogle CGI API for Japanese Inputをラッピングし、平仮名を日本語変換するRubyライブラリ。Glitch IMEはRuby製のオープンソース・ソフトウェア。英語はたった26文字しか種類がないが、日本語はその100倍近くの文字が存在する(常用レベルでも)。それらをアル...
テキスト入力を解析して素早くiCalに予定を登録「Remind Me Later」
Remind Me Laterはテキスト入力からiCalの予定を作成、登録するソフトウェア。Remind Me LaterはMac OSX用のフリーウェア。スケジュールというのはメールや電話で突然決まることが多い。そんな時にカレンダーを開いて細々予定を登録して完了ボタンを押す、なんて煩わしくて面倒になってしまう。予定を...
日本語も可。HTMLから可読性高いテキストを生成する「NReadability」
NReadabilityはコマンドラインでHTMLファイルからタイトルと本文を抽出した可読性高いテキストを作成する。NReadabilityはC#製、Windows用のオープンソース・ソフトウェア。ニュースサイトやブログ、掲示板などWebサイト上でテキストコンテンツを読ませるサイトはとても多い。そしてそのサイトの中には...
論文やレポートの添削に。高機能なドキュメントコメントシステム「Comt」
Comtは高機能なWebベースのテキスト添削システム。ComtはPython製のオープンソース・ソフトウェア。ブログやニュースサイト、フォーラム、論文、小説などインターネット上にはテキストコンテンツが溢れている。それらの公開された記事には大抵コメント機能がついており、感想を寄せることができる。ダッシュボードだが感想以外...
JavaScriptによる開発が大規模化したらドキュメントを生成「Dox」
DoxはJSDocに対応したソースファイルからドキュメントを生成するライブラリ。DoxはJavaScript/node.js製のオープンソース・ソフトウェア。JavaScriptがWebアプリケーション構築の際のメイン言語として使われるようになっている。その結果起こっているのがJavaScriptのコードの大規模化だ。...
テキストファイルでタスク管理。Todo.txtのAndroidフロントエンド「Todo.txt Touch」
Todo.txt Touchはテキストファイルでタスクを管理するTodo.txtのAndroid用アプリ。Todo.txt TouchはAndroid用のオープンソース・ソフトウェア。タスク管理を継続させるコツの一つは、いつでもどこでもメモしたりチェックできるようにすることだ。PCだけで管理していると立ち上げるのが面倒...
URLを引数に本文抽出を行うJavaライブラリ「Boilerplate」
BoilerplateはURLを与えると本文部分を抽出するライブラリ。BoilerplateはJava製のオープンソース・ソフトウェア。Webサイトをクローリングしたり、そのサイト内にあるテキストを使って別なWebサービスを構築すると言った手法はよく存在する。そんな時に必要になるのが本文抽出というテクニックだ。デモWe...
テキスト解析を使ったシステム連携に。Webベースの形態素解析エンジン「Igo GAE」
Igo GAEはGoogle App Engine/Javaを使って形態素解析エンジンのIgoを動作させる。/s2IfIgo GAEはJava製/Google App Engine用のフリーウェア(ソースコードは公開されている)。日本語を解析するのに使われているのがいわゆる「形態素解析」だ。名詞や形容詞などに分割するこ...