百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 博客教程 > 正文

利用IPFS和GeoHash构建具有地理位置价值服务的DDApp(一)

connygpt 2024-10-16 08:45 7 浏览

一、概述

1.1 项目意义

打造地理位置信息与区块链的关系对象模型,建立一套

人->位置->真实世界->传递信任->价值转移->位置->人 的生态模型,实现用区块链来索引真实世界的愿景。

通过GeoHash算法可以大幅度提高在庞大位置数据中的检索效率,同时为应用提供便捷的缓存机制。

IPFS&Filecoin技术则可以保证在一个可信的区块链网络中去大规模传递与海量位置信息相关联的海量文件、数据集合,并保证传递过程中数据的产权价值。

1.2 名词解释

DDApp ( Data Decentered Application ):是一个数据去中心化应用的概念,介于传统应用和去中心化应用之间,解决了DApp不能依赖中心化的API的问题,又保证部分需要去中心化场景下的数据,在与应用交互之外,还可以独立分布部署、P2P传输。

IPFS

IPFS全称InterPlanetary File System,中文名:星际文件系统,是一个旨在创建持久且分布式存储和共享文件的网络传输协议。它是一种内容可寻址的对等超媒体分发协议可以让网络更快、更安全、更开放。它是一个面向全球的、是一个点对点的分布式版本文件系统,试图将所有具有相同文件系统的计算设备连接在一起。

GeoHash

Geohash是由Gustavo Niemeyer发明的公共域地理编码系统,它将一个地理位置编码成一串字母和数字。

它是一种层次化的空间数据结构,将空间细分为网格形状的桶,是一种被称为z -阶空间填充曲线的应用,下图中就是GeoHash算法中常用的Peano曲线,一种四叉树线性编码方式。

GeoHash数据将具有如下3个特点:

  • 1)GeoHash将二维的经纬度转换成字符串,比如下图展示了北京9个区域的GeoHash字符串,分别是WX4ER,WX4G2、WX4G3等等,每一个字符串代表了某一矩形区域。也就是说,这个矩形区域内所有的点(经纬度坐标)都共享相同的GeoHash字符串,这样既可以保护隐私(只表示大概区域位置而不是具体的点),又比较容易做缓存,比如左上角这个区域内的用户不断发送位置信息请求餐馆数据,由于这些用户的GeoHash字符串都是WX4ER,所以可以把WX4ER当作key,把该区域的餐馆信息当作value来进行缓存,而如果不使用GeoHash的话,由于区域内的用户传来的经纬度是各不相同的,很难做缓存。

  • 2)字符串越长,表示的范围越精确。如图所示,5位的编码能表示10平方千米范围的矩形区域,而6位编码能表示更精细的区域(约0.34平方千米)

  • 3)字符串相似的表示距离相近(特殊情况后文阐述),这样可以利用字符串的前缀匹配来查询附近的POI信息。如下两个图所示,一个在城区,一个在郊区,城区的GeoHash字符串之间比较相似,郊区的字符串之间也比较相似,而城区和郊区的GeoHash字符串相似程度要低些。

例如,坐标对(116.414597,39.955441),位于北京安定门附近,GeoHash后形成的值为WX4G2

我们已经知道现有的GeoHash算法使用的是Peano空间填充曲线,这种曲线会产生突变,造成了编码虽然相似但距离可能相差很大的问题,因此在基于个人位置查询附近Poi信息时,首先筛选GeoHash编码相似的POI点,然后进行实际距离计算,来规避算法突变所造成的误差。

当然Geohash只是空间索引的一种方式,特别适合POI点数据,而对线Link、面数据采用R树索引更有优势

二、系统设计

2.1 架构设计

2.2 对象模型设计

Geo Object Model

属性类型备注
geo_idINT唯一标识
geo_addressSTRING地址名
geo_lngFLOAT位置经度
geo_latFLOAT位置纬度
geo_hashSTRING位置生成的GeoHash值
ipfs_hashSTRING所存数据的IpfsHash值
addGeoInfoByParam()FUNCTION添加位置信息方法
getGeoInfoByParam()FUNCTION获取位置信息方法
mixGeoHashByParam()FUNCTIONGeoHash生成算法
addIpfsDataByParam()FUNCTION添加Ipfs数据方法
mixIpfsHashByParam()FUNCTION关联Ipfs数据方法

2.3 数据库对象映射

2.3.1 数据库选型

这是网友以 100万 poi 数据查询范围 3km 内的点(最多取100条)的性能测试统计

以下是各数据库的对比情况:

数据库耗时区域查询多条件支持
redis(3.2.8)1-10ms支持不支持
mongo(3.4.4)10-50ms支持支持
postgreSQL(9.6.2)3-8ms支持支持
mysql(5.7.18)8-15ms支持支持

综合比较后,个人选择了MySql 来进行后文Demo的支撑数据库

- MySql在5.7.4以前版本的童鞋可以通过myISAM引擎提供的Geom内置函数来实现

- MySql在5.7.4以后版本的童鞋可以舒服的继续使用InnoDB引擎,官方对其添加了对空间索引的支持,感兴趣的朋友也可以对比下性能。

PS:

- 1 . 数据库没有哪个一定好,只要适合场景即可。

- 2 . 在研究IPFS存储性能的过程中,由于测试网络节点问题,有很严重的数据传输瓶颈,且不稳定,短期内,很难将需要频繁更新以及百万级别数据的检索逻辑事务放在IPFS这一层中来做。

- 3 . 在IPFS节点网络性能目前并不乐观的情况下,尝试去寻找能实现具有商业级别能力IPFS应用的过渡方案

2.3.2 对象模型映射成表结构

-- 表的结构 `geo_object`
--
CREATE TABLE `geo_object` (
 `geo_id` bigint(20) NOT NULL AUTO_INCREMENT,
 `geo_loc` point NOT NULL,
 `geo_address` varchar(255) NOT NULL,
 `ipfs_hash` varchar(255) NOT NULL
) ENGINE=MyISAM DEFAULT CHARSET=utf8 COMMENT='geo对象模型';
-- Indexes for table `geo_object`
ALTER TABLE `geo_object`
 ADD PRIMARY KEY (`geo_id`),
 ADD SPATIAL KEY `geo_loc` (`geo_loc`);

三、Demo

有了以上的概念和设计模型,接下来,给大家看一个简单的Demo实现:

3.1 通过IPFS上传位置数据

  • IPFS单节点的部署就不详细介绍了,这边可以参考文章【应用】利用IPFS构建自己的去中心化分布式Wiki系统 的实现过程

  • 官方提供了Curl的API方式,我们可以通过addIpfsDataByParam()方法实现RPC调用。

curl -F file=@myGeoFile "http://localhost:5001/api/v0/add?recursive=false&quiet=false&hash=sha2-256"
  • PS:这边Demo采用的是本地单节点的数据上传,为了保障服务的稳定性,建议使用ipfs-cluster的节点集群解决方案,具体方案可以参考IPFS资深大牛(飞向未来)的文章《IPFS家族二》

3.2 获取IPFS网络返回值,并关联数据

响应体为 ‘multipart/form-data’格式,成功,会返回如下Body数据:

{
 "Name":"myGeoFile"
 "Hash":"QmYftndCvcEiuSZRX7njywX2AGSeHY21Sa7VryCq1mK1Ew"
 "Bytes":"2428803"
 "Size": ""
}

拿到Hash值后,再通过mixIpfsDataByParam()方法关联到我们的Geo位置数据上

3.3 Geo模型预演

选取第一个基准位置点(模拟用户所在定位)

  • 维度lat:39.989049

  • 经度lng:116.313658

INSERT INTO `geo_object`(`geo_loc`, `geo_address`, `ipfs_hash`) VALUES (GeomFromText('POINT(39.989049 116.313658)'),'3W咖啡馆','QmYftndCvcEiuSZRX7njywX2A21Sa7VryCq1mK1Ew21')

选取第二个Geo位置点(模拟近点)

  • 维度lat:39.988878

  • 经度lng:116.313352

INSERT INTO `geo_object`(`geo_loc`, `geo_address`, `ipfs_hash`) VALUES (GeomFromText('POINT(39.988878 116.313352)'),'中关村创业大街南广场','WCJIEFSCvcE231233HY21Sa7Vr1Cq1mK1Ew')

选取第三个Geo位置点(模拟远点)

  • 维度lat:40.005466

  • 经度lng:116.315938

INSERT INTO `geo_object`(`geo_loc`, `geo_address`, `ipfs_hash`) VALUES (GeomFromText('POINT(40.005466 116.315938)'),'圆明园','KBYftndCvcEiuSZRX7njyw1332Y21Sa723mKASDED')

球面距离围栏算法

假设球面围栏对角点坐标A1(x1,y1),B1(x2,y2):

x1 = lat + distance / ( 111.1 / COS(RADIANS(lng))), 
y1 = lng + distance / 111.1 
x1 = lat - distance / ( 111.1 / COS(RADIANS(lng))), 
y1 = lng - distance / 111.1 
//构建一阶空间填充曲线
LineString(A1,B1)

PS:

- 1.赤道上经度的每个度大约相当于111.1km,经度的每个度的距离从0km到111.1km

- 2.RADIANS()为弧度计算内置函数

- 3.LineString() 为构建一阶空间填充曲线内置函数

3.4 获取地理区域内的IPFS数据服务

获取1km以内的IPFS数据

SELECT * 
 FROM geo_object 
 WHERE MBRContains 
 ( 
 LineString 
 ( 
 Point 
 ( 
 39.989049 + 1 / ( 111.1 / COS(RADIANS(116.313658))), 
 116.313658 + 1 / 111.1 
 ), 
 Point 
 ( 
 39.989049 - 1 / ( 111.1 / COS(RADIANS(116.313658))), 
 116.313658 - 1 / 111.1 
 ) 
 ), 
 geo_loc 
 )

如下图所示,我们拿到了距离3W咖啡馆1Km以内中关村大街南广场附近相关联的IPFS数据

获取10km以内的IPFS数据

SELECT * 
 FROM geo_object 
 WHERE MBRContains 
 ( 
 LineString 
 ( 
 Point 
 ( 
 39.989049 + 10 / ( 111.1 / COS(RADIANS(116.313658))), 
 116.313658 + 10 / 111.1 
 ), 
 Point 
 ( 
 39.989049 - 10 / ( 111.1 / COS(RADIANS(116.313658))), 
 116.313658 - 10 / 111.1 
 ) 
 ), 
 geo_loc 
 )

如下图所示,我们拿到了距离3W咖啡馆10Km以内圆明园附近相关联的IPFS数据

四、应用场景

  • Vevue:一个在选定的区域内街拍可获得代币奖励的DApp,鼓励用户分享原创内容,激励场景化广告。

  • 地理位置签到:只有到达指定位置坐标点,才可取得可信签到密码凭证,进行核对,确认地理位置信任问题。(滴滴加班公司打车报销场景)

  • 到店红包(糖果):,吸引用户到达指定实体店铺位置,通过位置可信核对,分发代币糖果凭证/快照,激励用户到店消费,体验现场活动。

  • 车主停车位产权保护:经过购买的专用停车位实为车主用户的资产,应受到产权保护,且车位的转移、交易需要在一套依赖地理位置的信任体系中进行。

  • 景区、名胜古迹、历史遗迹信息保护:沧海桑田,地转星移,也许有一天名胜古迹不复存在,但它们的电子信息(地理位置、图像、所属国家、历史文化、视频、VR全景等信息)将永远被保存在区块链上,真实且不被篡改,源远流长。

  • 与位置AR游戏结合:之前很火的Pokémon Go如果再加上Filecoin的奖励机制会是一种什么样的场面?也可以参考MANA区块链项目的价值。

  • 物联网结合: 充电桩,ETC这些具有支付属性、位置属性的智能设备创新等等。

五、开源计划

初衷:期望能让大家看到区块链的实际应用场景,为区块链和传统技术的结合做更多预演、布道、分享,不去听币圈熙熙攘攘的声音,用技术创造真实的价值,也期待更多和我一样想法的朋友加入,带一些正能量给这个圈子。

IPFS-Geo

意义:是一个具有地理位置特征的IPFS智能对象,其元数据具备Geo相关特性,支持千万级别空间数据的快速索引,对象内还提供LBS相关功能的接口服务。

  • 欢迎更多对这块感兴趣,志同道合的朋友留言或者私信,一起探讨

相关推荐

自学Python,写一个挨打的游戏代码来初识While循环

自学Python的第11天。旋转~跳跃~,我~闭着眼!学完循环,沐浴着while的光芒,闲来无事和同事一起扯皮,我说:“编程语言好神奇,一个小小的循环,竟然在生活中也可以找到原理和例子”,同事也...

常用的 Python 工具与资源,你知道几个?

最近几年你会发现,越来越多的人开始学习Python,工欲善其事必先利其器,今天纬软小编就跟大家分享一些常用的Python工具与资源,记得收藏哦!不然下次就找不到我了。1、PycharmPychar...

一张思维导图概括Python的基本语法, 一周的学习成果都在里面了

一周总结不知不觉已经自学Python一周的时间了,这一周,从认识Python到安装Python,再到基本语法和基本数据类型,对于小白的我来说无比艰辛的,充满坎坷。最主要的是每天学习时间有限。只...

三日速成python?打工人,小心钱包,别当韭菜

随着人工智能的热度越来越高,许多非计算机专业的同学们也都纷纷投入到学习编程的道路上来。而Python,作为一种相对比较容易上手的语言,也越来越受欢迎。网络上各类网课层出不穷,各式广告令人眼花缭乱。某些...

Python自动化软件测试怎么学?路线和方法都在这里了

Python自动化测试是指使用Python编程语言和相关工具,对软件系统进行自动化测试的过程。学习Python自动化测试需要掌握以下技术:Python编程语言:学习Python自动化测试需要先掌握Py...

Python从放弃到入门:公众号历史文章爬取为例谈快速学习技能

这篇文章不谈江流所专研的营销与运营,而聊一聊技能学习之路,聊一聊Python这门最简单的编程语言该如何学习,我完成的第一个Python项目,将任意公众号的所有历史文章导出成PDF电子书。或许我这个Py...

【黑客必会】python学习计划

阅读Python文档从Python官方网站上下载并阅读Python最新版本的文档(中文版),这是学习Python的最好方式。对于每个新概念和想法,请尝试运行一些代码片段,并检查生成的输出。这将帮助您更...

公布了!2025CDA考试安排

CDA数据分析师报考流程数据分析师是指在不同行业中专门从事行业数据搜集、整理、分析依据数据作出行业研究评估的专业人员CDA证书分为1-3级,中英文双证就业面广,含金量高!!?报考条件:满18...

一文搞懂全排列、组合、子集问题(经典回溯递归)

原创公众号:【bigsai】头条号:程序员bigsai前言Hello,大家好,我是bigsai,longtimenosee!在刷题和面试过程中,我们经常遇到一些排列组合类的问题,而全排列、组合...

「西法带你学算法」一次搞定前缀和

我花了几天时间,从力扣中精选了五道相同思想的题目,来帮助大家解套,如果觉得文章对你有用,记得点赞分享,让我看到你的认可,有动力继续做下去。467.环绕字符串中唯一的子字符串[1](中等)795.区...

平均数的5种方法,你用过几种方法?

平均数,看似很简单的东西,其实里面包含着很多学问。今天,分享5种经常会用到的平均数方法。1.算术平均法用到最多的莫过于算术平均法,考试平均分、平均工资等等,都是用到这个。=AVERAGE(B2:B11...

【干货收藏】如何最简单、通俗地理解决策树分类算法?

决策树(Decisiontree)是基于已知各种情况(特征取值)的基础上,通过构建树型决策结构来进行分析的一种方式,是常用的有监督的分类算法。决策树算法是机器学习中的一种经典算法,它通过一系列的规则...

面试必备:回溯算法详解

我们刷leetcode的时候,经常会遇到回溯算法类型题目。回溯算法是五大基本算法之一,一般大厂也喜欢问。今天跟大家一起来学习回溯算法的套路,文章如果有不正确的地方,欢迎大家指出哈,感谢感谢~什么是回溯...

「机器学习」决策树——ID3、C4.5、CART(非常详细)

决策树是一个非常常见并且优秀的机器学习算法,它易于理解、可解释性强,其可作为分类算法,也可用于回归模型。本文将分三篇介绍决策树,第一篇介绍基本树(包括ID3、C4.5、CART),第二篇介绍Ran...

大话AI算法: 决策树

所谓的决策树算法,通俗的说就是建立一个树形的结构,通过这个结构去一层一层的筛选判断问题是否好坏的算法。比如判断一个西瓜是否好瓜,有20条西瓜的样本提供给你,让你根据这20条(通过机器学习)建立起...