Jeff Bezos氏のLetter to Shareholders, 2010

機械翻訳したものです。

********

株主の皆様へ

ランダムフォレスト、ナイーブベイズ推定量、RESTfulサービス、ゴシッププロトコル、最終的な一貫性、データシャーディング、アンチエントロピー、ビザンチンクォーラム、消去符号化、ベクトルクロック......Amazonのある会議に参加すると、コンピュータサイエンスの講義に出くわしたかのように一瞬思うかもしれません。

ソフトウェアアーキテクチャに関する最新の教科書を読めば、Amazonで適用していないパターンはほとんどないでしょう。高性能トランザクションシステム、複雑なレンダリングとオブジェクトキャッシング、ワークフローとキューイングシステム、ビジネスインテリジェンスとデータ分析、機械学習とパターン認識、ニューラルネットワークと確率的意思決定など、さまざまなテクニックを駆使しています。私たちのシステムの多くは、最新のコンピュータサイエンスの研究に基づいていますが、それだけでは十分でないことも多く、アーキテクトやエンジニアは、まだ学術的に行われていない方向に研究を進めなければなりませんでした。私たちが直面している問題の多くは、教科書的な解決策がないため、私たちは喜んで新しいアプローチを考案しています。

私たちの技術は、ほとんどがサービスとして実装されています。サービスは、操作するデータをカプセル化し、その機能にアクセスする唯一の方法として、強化されたインターフェースを提供するロジックの断片です。このアプローチは、副作用を減らし、システム全体の他のコンポーネントに影響を与えることなく、サービスが独自のペースで進化することを可能にします。サービス指向アーキテクチャー(SOA)は、アマゾンのテクノロジーを構成する基本的な抽象概念です。思慮深く先見の明のあるエンジニアとアーキテクトのチームのおかげで、SOAが業界のバズワードになるずっと前から、このアプローチはアマゾンで適用されています。私たちのEコマースプラットフォームは、何百ものソフトウェアサービスの連合体で構成されており、それらが協調して動作することで、レコメンデーションから注文処理、在庫追跡まで、さまざまな機能を提供しています。例えば、Amazon.comを訪れたお客様のために商品詳細ページを作成するために、当社のソフトウェアは200から300のサービスを呼び出し、そのお客様に高度にパーソナライズされた体験を提供しています。

状態管理は、非常に大きなサイズに成長する必要のあるシステムの心臓部です。数年前、アマゾンの要求は、私たちのシステムの多くが商用ソリューションでは対応できないレベルに達していました。このような厳しい要求を満たすために、私たちは独自のキーバリューストアやシングルテーブルストアなど、いくつかの代替となる専用の永続化ソリューションを開発しました。そのために、私たちは、分散システムやデータベースの研究コミュニティから得た基本原則を重視し、そこから発展させてきました。私たちが開発したストレージシステムは、パフォーマンス、可用性、コストを厳密にコントロールしながら、極めて高いスケーラビリティを実現しています。このような超大規模な特性を実現するために、これらのシステムではデータ更新管理に新しいアプローチを採用しています。大量のレプリカに配信する必要のある更新の同期要件を緩和することで、これらのシステムは最も厳しい性能と可用性の条件の下でも生き残ることができます。これらの実装は、eventual consistency(最終的な一貫性)という概念に基づいています。アマゾンのエンジニアが開発したデータ管理の進歩は、アマゾンウェブサービス(AWS)が提供するクラウドストレージやデータ管理サービスの基盤となるアーキテクチャの出発点となっています。例えば、Simple Storage Service、Elastic Block Store、SimpleDBなどの基本的なアーキテクチャは、すべてアマゾン独自の技術に由来しています。

Amazonのビジネスの他の分野でも、製品データの取り込みと分類、需要予測、在庫配分、不正行為の検出など、同様に複雑なデータ処理と意思決定の問題に直面しています。ルールベースのシステムをうまく利用することもできますが、メンテナンスが大変で、時間が経つと脆くなってしまいます。多くの場合、高度な機械学習技術は、より正確な分類を提供し、変化する状況に適応するために自己修復することができます。例えば、当社の検索エンジンでは、バックグラウンドで実行されるデータマイニングと機械学習アルゴリズムを採用してトピックモデルを構築しています。また、情報抽出アルゴリズムを適用して属性を識別し、構造化されていない記述からエンティティを抽出することで、お客様が検索を絞り込み、目的の製品を素早く見つけられるようにしています。検索の関連性については、多くの要素を考慮して、お客様が興味を持つ確率を予測し、検索結果の順位を最適化しています。商品の多様性に伴い、何千もの商品属性をランク付け時に柔軟に組み込むために、学習済みのランダムフォレストや決定木などの最新の回帰技術を採用する必要があります。このような舞台裏のソフトウェアの最終結果は?それは、お客様が欲しいものを見つけるのに役立つ、速くて正確な検索結果です。

私たちがテクノロジーにかける努力は、テクノロジーを研究開発部門のようなところに置いておけば、さほど重要ではないかもしれませんが、私たちはそのようなアプローチをとりません。テクノロジーは、私たちのすべてのチーム、すべてのプロセス、意思決定、そして各ビジネスにおけるイノベーションへのアプローチに浸透しています。テクノロジーは、私たちのすべての活動に深く浸透しています。

その一例がWhispersyncです。Whispersyncは、どこに行っても、どんなデバイスを持っていても、Kindleデバイスやモバイルアプリケーション間で同期して、リーディングライブラリやすべてのハイライト、メモ、ブックマークにアクセスできるように設計されたKindleのサービスです。技術的な課題は、世界100カ国以上に住む何百万人ものKindleユーザーが、何億冊もの本と何百種類ものデバイスを使って、24時間365日の信頼性でこれを実現することです。Whispersyncの中核となるのは、最終的に一貫性のある複製データストアであり、アプリケーションが定義した競合解決策によって、数週間またはそれ以上続くデバイスの孤立に対処しなければならず、また対処することができます。Kindleをご利用のお客様には、もちろん、この技術をすべて隠しています。お客様がKindleを開くと、同期していて正しいページが表示されます。アーサー・C・クラークの言葉を借りれば、十分に進化したテクノロジーのように、それは魔法と見分けがつかないのです。

さて、この手紙を熱心に読んでくださっている株主の皆様の中には、この時点で目が曇ってしまっている方もいらっしゃるかもしれませんが、私の考えでは、これらの技術は無為に追求されるものではなく、フリーキャッシュフローに直接つながるものだと指摘して、目を覚ましていただきたいと思います。

私たちは、利用可能な帯域幅、ディスクスペース、処理能力が驚異的に増加した時代に生きており、これらはすべて、急速に安くなり続けています。私たちのチームには、世界で最も洗練された技術者がいます。
- 私たちのチームには、世界で最も洗練された技術者がいて、今日の可能性のギリギリのところにある課題を解決しています。これまで何度も述べてきたように、私たちは、株主の長期的な利益とお客さまの利益が完全に一致しているという揺るぎない信念を持っています。

そして、私たちはそのようにしたいと思っています。私たちのDNAには発明があり、テクノロジーは、お客様に提供する体験のあらゆる側面を進化させ、改善するための基本的なツールです。まだまだ学ぶことがたくさんありますが、これからも楽しみながら学んでいきたいと思います。私はこのチームの一員であることに大きな誇りを持っています。

いつものように、1997年のオリジナルレターのコピーを添付します。私たちのアプローチは変わらず、それは今でもDay 1です。


ジェフリー・P・ベゾス
創業者兼最高経営責任者
Amazon.com, Inc.

********

原文です。(添付の1997年の手紙は割愛)

To our shareowners:

Random forests, naïve Bayesian estimators, RESTful services, gossip protocols, eventual consistency, data sharding, anti-entropy, Byzantine quorum, erasure coding, vector clocks … walk into certain Amazon meetings, and you may momentarily think you’ve stumbled into a computer science lecture.

Look inside a current textbook on software architecture, and you’ll find few patterns that we don’t apply at Amazon. We use high-performance transactions systems, complex rendering and object caching, workflow and queuing systems, business intelligence and data analytics, machine learning and pattern recognition, neural networks and probabilistic decision making, and a wide variety of other techniques. And while many of our systems are based on the latest in computer science research, this often hasn’t been sufficient: our architects and engineers have had to advance research in directions that no academic had yet taken. Many of the problems we face have no textbook solutions, and so we -- happily -- invent new approaches.

Our technologies are almost exclusively implemented as services: bits of logic that encapsulate the data they operate on and provide hardened interfaces as the only way to access their functionality. This approach reduces side effects and allows services to evolve at their own pace without impacting the other components of the overall system. Service-oriented architecture -- or SOA -- is the fundamental building abstraction for Amazon technologies. Thanks to a thoughtful and far-sighted team of engineers and architects, this approach was applied at Amazon long before SOA became a buzzword in the industry. Our e-commerce platform is composed of a federation of hundreds of software services that work in concert to deliver functionality ranging from recommendations to order fulfillment to inventory tracking. For example, to construct a product detail page for a customer visiting Amazon.com, our software calls on between 200 and 300 services to present a highly personalized experience for that customer.

State management is the heart of any system that needs to grow to very large size. Many years ago, Amazon’s requirements reached a point where many of our systems could no longer be served by any commercial solution: our key data services store many petabytes of data and handle millions of requests per second. To meet these demanding and unusual requirements, we’ve developed several alternative, purpose-built persistence solutions, including our own key-value store and single table store. To do so, we’ve leaned heavily on the core principles from the distributed systems and database research communities and invented from there. The storage systems we’ve pioneered demonstrate extreme scalability while maintaining tight control over performance, availability, and cost. To achieve their ultra-scale properties these systems take a novel approach to data update management: by relaxing the synchronization requirements of updates that need to be disseminated to large numbers of replicas, these systems are able to survive under the harshest performance and availability conditions. These implementations are based on the concept of eventual consistency. The advances in data management developed by Amazon engineers have been the starting point for the architectures underneath the cloud storage and data management services offered by Amazon Web Services (AWS). For example, our Simple Storage Service, Elastic Block Store, and SimpleDB all derive their basic architecture from unique Amazon technologies.

Other areas of Amazon’s business face similarly complex data processing and decision problems, such as product data ingestion and categorization, demand forecasting, inventory allocation, and fraud detection. Rule- based systems can be used successfully, but they can be hard to maintain and can become brittle over time. In many cases, advanced machine learning techniques provide more accurate classification and can self-heal to adapt to changing conditions. For example, our search engine employs data mining and machine learning algorithms that run in the background to build topic models, and we apply information extraction algorithms to identify attributes and extract entities from unstructured descriptions, allowing customers to narrow their searches and quickly find the desired product. We consider a large number of factors in search relevance to predict the probability of a customer’s interest and optimize the ranking of results. The diversity of products demands that we employ modern regression techniques like trained random forests of decision trees to flexibly incorporate thousands of product attributes at rank time. The end result of all this behind-the-scenes software? Fast, accurate search results that help you find what you want.

All the effort we put into technology might not matter that much if we kept technology off to the side in some sort of R&D department, but we don’t take that approach. Technology infuses all of our teams, all of our processes, our decision-making, and our approach to innovation in each of our businesses. It is deeply integrated into everything we do.

One example is Whispersync, our Kindle service designed to ensure that everywhere you go, no matter what devices you have with you, you can access your reading library and all of your highlights, notes, and bookmarks, all in sync across your Kindle devices and mobile apps. The technical challenge is making this a reality for millions of Kindle owners, with hundreds of millions of books, and hundreds of device types, living in over 100 countries around the world—at 24x7 reliability. At the heart of Whispersync is an eventually consistent replicated data store, with application defined conflict resolution that must and can deal with device isolation lasting weeks or longer. As a Kindle customer, of course, we hide all this technology from you. So when you open your Kindle, it’s in sync and on the right page. To paraphrase Arthur C. Clarke, like any sufficiently advanced technology, it’s indistinguishable from magic.

Now, if the eyes of some shareowners dutifully reading this letter are by this point glazing over, I will awaken you by pointing out that, in my opinion, these techniques are not idly pursued – they lead directly to free cash flow.

We live in an era of extraordinary increases in available bandwidth, disk space, and processing power, all of which continue to get cheap fast. We have on our team some of the most sophisticated technologists in the world
– helping to solve challenges that are right on the edge of what’s possible today. As I’ve discussed many times before, we have unshakeable conviction that the long-term interests of shareowners are perfectly aligned with the interests of customers.

And we like it that way. Invention is in our DNA and technology is the fundamental tool we wield to evolve and improve every aspect of the experience we provide our customers. We still have a lot to learn, and I expect and hope we’ll continue to have so much fun learning it. I take great pride in being part of this team.

As always, I attach a copy of our original 1997 letter. Our approach remains the same, and it’s still Day 1.


Jeffrey P. Bezos
Founder and Chief Executive Officer
Amazon.com, Inc.

この記事が気に入ったらサポートをしてみませんか?